OpenAIがDay2の新機能「強化学習fine-tuning」をリリースし、AI専門分野の学習精度を高める

動區BlockTempo

2024-12-07 09:56:10

OpenAI は新製品イベント Day2 で、「強化学習微調」(RFT) 機能をリリースし、ユーザーがカスタムモデルの個々の領域における推論能力を向上させ、モデルの精度を向上させることができるようにし、この機能は科学研究、法律、金融、保険、エンジニアリングなどの多くの領域で利用できます。（前提：OpenAI が完全版 o1 モデルと新しいサブスクリプションプラン ChatGPT Pro を発表、月額 200 ドルは価値があるか？）（背景：OpenAI が 12 日間の連続放送を発表：多くの新機能をリリース、AI コンセプト通貨は待ち伏せされていますか？） ChatGPT の開発元である OpenAI は、5 日に 6 日の午前 2 時から 12 日間の新製品発表を行うと予告しました。初日にはプレビューバージョンを置き換える完全版推論モデル o1 が登場し、現在 ChatGPT Plus、Team、Pro ユーザーは使用できるようになっており、同時に o1 モデルを無制限に使用できるサブスクリプションプラン「ChatGPT Pro」も発表されました。詳細：OpenAI が完全版 o1 モデルと新しいサブスクリプションプラン ChatGPT Pro を発表、月額 200 ドルは価値があるか？そして今日（7日）は Day2 ですが、OpenAI は私たちにどんな驚きを用意していますか？「強化学習微調」の新機能をリリース第2日の製品発表では、OpenAI は「強化学習微調」(RFT) の新機能をリリースし、ユーザーが独自のデータセットを使用して o1 モデルを強化学習アルゴリズムでカスタムトレーニングできるようになりました。また、司会者は、「強化学習微調」には数十の高品質な例があれば、モデルの特定の領域での推論能力を迅速に向上させることができると述べています。この機能は科学研究、法律、金融、保険、エンジニアリングなどの多くの領域で利用できます。また、発表ビデオでは、バークレーネーショナルラボの計算生物学者 Justin Reese がモデルのデモンストレーションに参加し、「強化学習微調」がまれな疾患の診断にどのように役立つかを共有しています。 Reese のデモンストレーションで、o1 モデルの元の識別精度は 25% であり、o1 mini モデルの元の識別精度は 17% であり、強化学習微調後の o1 mini モデルの精度は 31% に向上し、精度の増加率は 82% に達しました。「強化学習微調」機能は特定の領域でモデルの精度と専門性を大幅に向上させますが、司会者は、現在この機能はプレビュー段階にあり、来年に一般公開する予定であると述べています。また、OpenaAI は現在、RFT alpha プロジェクトを立ち上げており、大学、研究機関、企業などの組織がこの機能のテストに参加するよう呼びかけています。関連記事 ChatGPT が「David Mayer」などの名前に返信しないと報じられ、OpenAI が情報を意図的に封鎖していると疑われています OpenAI が 12 日間の連続放送を発表：多くの新機能をリリース、AI コンセプト通貨は待ち伏せされていますか？ OpenAI が完全版 o1 モデルと新しいサブスクリプションプラン ChatGPT Pro を発表、月額 200 ドルは価値があるか？〈OpenAI発表Day2》逆天「強化学習微調」新機能、增強AI専門領域の学習精度〉この記事は最初に BlockTempo で発表されました。

原文表示

免責事項：このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

0/400

コメントなし