株式会社Adansons(本社:宮城県仙台市、以下「Adansons」)は、非構造化データのメタ情報を整理し、AI学習用データセットの作成・管理を容易にするデータマネジメントツール「Adansons Base」をリリースしました。 ウェブサイト(日本語版):https://adansons ...
Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset*(キュリンデータセット)』において、『日本語・3話者・話者分離・日常会話 ...
同社では、高性能かつオープンなモデルファミリーの1つとしてNemotronを構築しており、Nemotron-Personas-Japanはすでに利用されているUS Personasデータセットを基盤としている。オープンソースのLLM(大規模言語モデル)とシームレスに連携できるため、企業向け ...
同社は「話者ごとの発話数」が話者認識のためのデータセットの有効性を決定付ける重要な要素であるとして、出演頻度に基づいて話者を選択し、話者ごとに十分な発話量を確保した。話者1人当たりの発話数は、同種のデータセットでは一般的に100~200程度 ...
-生命現象や疾患の転写メカニズム研究の効率化に貢献- 理化学研究所(理研)生命医科学研究センター大容量データ管理技術開発ユニットのイマド・アブケセーサ研究員、野口修平研究員(研究当時)、粕川雄也ユニットリーダーの研究チームは、ヒトや ...
FastLabel株式会社は9日、大規模な生成AI開発において発生するデータの課題を解決する、「汎用モデル向けデータセット提供」「インストラクションデータ作成」「ファインチューニングサービス」「RAG向けデータセット提供」「RAGデータ作成」「RAGデータ ...
動画内人物の肖像権もクリア!フレーム間のトラッキング、動作検出にも最適 写真・イラスト・動画・音楽素材のマーケットプレイス「PIXTA(ピクスタ)」( https://pixta.jp)を運営するピクスタ株式会社(東京都渋谷区代表取締役社長:古俣大介、東証 ...
OpenAIは9日(米国時間)、AIモデルのトレーニングのためのパブリックやプライベートなデータセット作成に向けて各社と協力する取り組み「OpenAI Data Partnerships」を発表した。 AIの進化においては、広範な学習データセットが必要だが、利用可能な大規模な ...
ミュンヘン工科大学が世界中のすべての建物を網羅した高解像度3Dデータセット「GlobalBuildingAtlas」を公開しました。GlobalBuildingAtlasは都市開発や防災などに役立つとされており、データセットを活用した3D地図も公開さ ...
「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。 大学共同利用機関法人情報・システム研究機構 データサイエンス共同利用基盤施設 人文学オープンデータ共同利用センター(CODH)が、 江戸時代に関する空間的 ...