OpenAIがAIエージェントの性能を測定するベンチマークテスト「EVMbench」を発表しました。EVMbenchは仮想通貨ブロックチェーンのスマートコントラクトに存在する脆弱(ぜいじゃく)性の「検知能力」「修正能力」「悪用能力」を測定するテストで ...
UL Solutionsのベンチマーク部門であるUL Benchmarkは,定番の3Dグラフィックスベンチマークアプリ「3DMark」に追加すると予告していた新ベンチマークテスト「Steel Nomad」(関連記事)を,欧州時間2024年5月21日にリリースすることを明らかにした。 Steel Nomadの ...
スマートフォンの性能を知るにはベンチマークアプリを使って測定する必要があり、中国のベンチマークアプリ「AnTuTu Benchmark(安兔兔评测)」はCPUやGPUだけではなくユーザー体験を含めたスマートフォンの総合的な性能を測定できるベンチマークアプリです。
「Puget Bench」はWindowsとmacOS向けのベンチマークツールで、PhotoshopやPremiere ProやDaVinci ...
ゲーミングノートPCといえば派手な装飾を思い浮かべる人も多いかもしれないが、近年はオフィスやカフェなど日常の風景に溶け込む「ステルス」なデザインがトレンドになりつつある。マウスコンピューターの新モデル「G TUNE P5(レッド)」をチェックした。
NVIDIAの新世代GPU「GeForce RTX 5070 Ti」の発売が2月20日に予定されている。国内販売想定価格が14万8,800円からと発表されているBlackwell世代の準ハイエンドGPUで、先に発売された上位GPU同様に高い注目を集めている。 今回、同GPUを搭載するPalit Microsystems製のビデオ ...
株式会社LegalOn Technologies(本社:東京都渋谷区代表取締役 執行役員・CEO:角田望、以下LegalOn Technologies)は、日本の企業法務実務における大規模言語モデル(LLM)の性能を評価するベンチマークデータセット「Legal Rikai: Open Benchmark」を公開しました。「Legal ...
Arrow Lakeの名で知られるIntelの新世代デスクトップ向けCPU「Core Ultra 200Sシリーズ」が、10月25日(日本時間)に発売される。 この発売に先立ち、最上位モデルの「Core Ultra 9 285K」とエントリーモデルの「Core Ultra 5 245K」をテストする機会が得られたので、Intelの新 ...
Game Science Interactive Technologyは、8月20日発売予定の最新ゲームタイトル『Black Myth: Wukong(黒神話:悟空)』に先駆けて、PC版ベンチマークテストをSteamで公開した。無料でダウンロードできる。 中国古典小説のうち「四大奇書」の一つに数えられる『西遊記』を ...
総合ベンチマークソフト「CrystalMark Retro」の最新ベータ版v2.0 Beta4が、3月2日にリリースされた。併せて、ベンチマーク ...
自分が使っているLLMの性能はどの程度なのか。そもそもLLMの性能を評価するにはどうすればよいのか。そうした疑問を解消する、LLMの「ベンチマーク」や実施方法を紹介する。 LLMのベンチマークは、LLMの性能を評価するための標準化された手順や指標だ。
カプコンは2月5日、オープンベータテストを控える『モンスターハンターワイルズ』のベンチマークテストをSteam上で公開した。ゲーム本編を購入しなくても無料で利用できる。 『モンハンワイルズ』ベンチマークテストがSteamに登場、超重量級の新作を購入前にチェックできる ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する