「Audio API」の「Text to Speech」についてまとめました。 ・Text to speech 1. Text to Speech 1-1. Text to Speech 「Audio API」は、1つの「Text to Speech」エンドポイントを提供します。 カスタムボイスや自分のボイスのコピーの作成はサポートしていません。 APIからのすべての ...
「OpenAI」の「Chat Completions API」のオーディオ入出力を試したのでまとめました。 1. Chat Completions API のオーディオ入出力 OpenAIの一部のモデルは、テキストや画像に加えて、オーディオ入出力に対応しています。オーディオ入力は、テキスト単独よりも豊富な ...
OpenAIが「OpenAI o1(正式リリース版)」のAPIを公開しました。合わせて、AIとの音声会話機能を提供する「Realtime API」のアップデートや、モデル微調整機能のアップデート、GoライブラリおよびJavaライブラリのリリースも発表されています。 OpenAI o1のAPIは ...
ログインして、InfoQのすべての体験をアンロックしましょう!お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。 クラウドコンピューティングの登場以降、ソフトウェア業界は大きな変革の中に ...
米OpenAIが新モデル「GPT-5.4」を発表した。実務タスクへの最適化を掲げ、推論やコーディング、ツール連携を一体的に強化。コンピュータ操作機能もネイティブ統合され、デスクトップ操作能力を測るベンチマーク「OSWorld-Verified」では人 ...
ユーザーの立場ではAIネイティブな働き方が身近に迫っており、データサイエンティストやMLエンジニアにとってはGPTを活用した開発を意識する必要が出てくる中、マイクロソフトの取り組みやML開発のパラダイムシフトをご紹介する「ChatGPTによって描かれる ...
実務はここまで自動化できるのか。OpenAIが発表した「GPT5.4」は、推論とエージェントを前提に再設計されました。最大100万トークンの長文脈やコンピュータ操作のネイティブ対応など、業務要件に直結する更新が並びます。数字で示された性能差 ...
米OpenAIは3月11日(現地時間)、開発者や企業が信頼性の高いエージェントを構築するための「Responses API」と「Agents SDK」を発表した。 同社の「Operator」やChatGPTの「deep research」などのエージェントは、指示されたタスクを理解し、複数のタスクを組み合わせて ...
米OpenAIは3月11日(現地時間、以下同)、開発者や企業が信頼性の高いAIエージェントを構築するための新しいAPIおよびツール群を発表した。これらの新ツールはコアエージェントのロジックやオーケストレーション、インタラクションを合理化し、開発者に ...
OpenAIは3月11日(現地時間)、AIエージェントの開発を支援する新たなAPI「Responses API」と開発者向けツール「Agents SDK」を発表した。 AIエージェントへの関心は近年高まっているが、その定義は依然として曖昧である。OpenAIはエージェントを「ユーザーに代わっ ...
Microsoftのサイバー脅威対応チームであるDetection and Response Team(DART)が、ChatGPTなどを開発するOpenAIのAPIを悪用するバックドア型マルウェア「SesameOp」について報告しました。研究者によると、脅威アクターはバックドアを利用して長期的なスパイ活動を行って ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する