また、コーディング能力を測るテスト「SWE―Bench Pro」で課されたタスクの成功率は80.3%で、競合する米オープンAIの主力モデル「GPT5.5」の58.6%を上回る。より高度なタスクを課すテスト「FrontierCode」でもGPT5.5の ...