Sakana AI(株)は6月5日、会計不正検知をはじめとする高度な金融タスクにおける大規模言語モデル(LLM)の性能を測定する日本語金融ベンチマーク「EDINET-Bench」を開発した。データセットをHugging Faceにて、構築ツールおよび評価コードをGitHubにて公開している。
~主要LLMであるGPT-5、Gemini-2.5-pro、Claude Opus 4.1の分析結果も発表。抽象的な指示への対応力でモデル間に大きな差を検出~ 株式会社LegalOn Technologies(本社:東京都渋谷区代表取締役 執行役員・CEO:角田望、以下LegalOn Technologies)は、日本の企業法務実務におけ ...
データセンターに求められる省エネ対策・ベンチマーク制度への対応とは 2022年4月施行の改正省エネ法ベンチマーク制度により、データセンターサービス業は一定規模以上などの諸条件であれば、PUE値報告が義務付けられた。一方で、電力価格の高騰もあり ...
データ・アプリケーション<3848>は18日、同社のカスタマー・サポート・サービスが、HDI-Japanの主催する2024年度のHDI格付けベンチマーク「クオリティ格付け」部門にて、三つ星を獲得したと発表。 同社のカスタマー・サポート・サービスが三つ星を獲得するの ...
~「Gemini 3」は、契約書業務において構造化された推論・ルールの適用が重視されるタスクでは高い成果を発揮するものの、応答速度に課題~ 株式会社LegalOn Technologies(本社:東京都渋谷区、代表:代表取締役 執行役員・CEO:角田望、以下LegalOn Technologies ...
膨大な医療ビッグデータを紐解き、コロナ禍の『医療崩壊の真実』(詳細はこちら)に迫ったことで知られる株式会社グローバルヘルスコンサルティング・ジャパン(GHC=本社・東京都新宿、代表取締役社長・渡辺幸子)。本業の病院経営コンサルティング ...
定番ストレージベンチでリード1万2000MB/秒を確認 まずはストレージベンチマークの定番「CrystalDiskMark 8.0.6」で、連続 ...
コンピュータービジョンは自動運転車やスマートフォンなどさまざまな分野に活用されていますが、多くのデータセットは依然としてバイアスや多様性の欠如、倫理的に責任のある方法で収集されていない、つまりは被写体の同意なしに写真がAI ...
データ収集システム(DAQ)市場は、様々な業界におけるリアルタイムデータ監視、分析、制御の需要の高まりを背景に、大幅な成長を遂げています。DAQシステムは、温度、圧力、振動、電圧、流量といった物理パラメータを収集、デジタル化し、測定可能な ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する