米OpenAIは2月28日(日本時間)、同社の大規模言語モデル「GPT-4.5」の研究プレビューを公開した。このモデルはGPT-4oをベースに構築されており、学習方法などを工夫することで“長考”をしなくても性能が向上したほか、会話の自然さも改善された。本記事で ...
何かと話題の対話型AIであるChatGPTだけれども、その開発元であるOpenAIが提供しているサービス・機能はChatGPT以外にもいくつかある。その1つが「Whisper」という音声データから文字起こししてくれる機能だ。 筆者の場合、たとえば取材のときに録音し、それを ...
大規模言語モデル(LLM)が得意なタスクは、大きく分けて要約・推論・変換・拡張の四分野に分けられる。それで、文章を要約したり翻訳したりするのは、LLMの得意なタスクだ。それで、筆者もよく翻訳や要約にChatGPTを利用している。 とは言え、専用ツールが ...
OpenAIが「OpenAI o1(正式リリース版)」のAPIを公開しました。合わせて、AIとの音声会話機能を提供する「Realtime API」のアップデートや、モデル微調整機能のアップデート、GoライブラリおよびJavaライブラリのリリースも発表されています。 OpenAI o1のAPIは ...
OpenAIは多様なAI機能をAPIを介して展開しており、音声データを文字起こししてテキストデータとして出力するAPIも提供しています。この文字起こしAPIについて、ソフトウェアエンジニアのジョージ・マンディス氏が「音声データを2倍速か3倍速にすると、品質 ...
Realtime API supports multi-model text and speech experiences including natural speech-to-speech conversations using preset voices already supported in the API. OpenAI has introduced a public beta of ...
ログインして、InfoQのすべての体験をアンロックしましょう!お気に入りの著者やトピックの最新情報を入手し、コンテンツと交流し、限定リソースをダウンロードできます。 クラウドコンピューティングの登場以降、ソフトウェア業界は大きな変革の中に ...
OpenAIが、OpenAI Japan合同会社を設立した。同社の代表には、同社の代表執行役員社長には、アマゾンウェブサービス(AWS)ジャパンの社長を2024年3月11日付で退任した長﨑忠雄氏が就任した。OpenAIの拠点はサンフランシスコ、ロンドン、ダブリンに次いで4拠点目と ...