- 1: すらいむ ★ 2025/04/21(月) 23:33:55.89 ID:+A5e8kSG
- OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明
OpenAIは2025年4月16日に、新しい推論モデルの「o3」と「o4-mini」を発表しました。
同社は特にo3を「OpenAI史上最も高度な推論モデル」と位置づけていますが、同時にリリースされた技術レポートと独立した外部調査により、両モデルがGPT-4oなどの従来モデルよりも幻覚(ハルシネーション)を起こしやすい傾向があり、OpenAIはその原因を把握できていないことが示されました。
OpenAI o3 and o4-mini System Card
(PDFファイル)https://cdn.openai.com/pdf/2221c875-02dc-4789-800b-e7758f3722c1/o3-and-o4-mini-system-card.pdf
(以下略、続きはソースでご確認ください)
Gigazine 2025年04月21日 14時00分
https://gigazine.net/news/20250421-openai-hallucinate-o3-o4-mini/
引用元: ・【AI】OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明 [すらいむ★]
- 6: 名無しのひみつ 2025/04/22(火) 04:28:49.42 ID:O+vnwDaT
- 省エネ性能に優れるってことは、つまり「深く考えない」ってことw
「いいやテキトーに答えとけ」ってなもんよw - 7: 名無しのひみつ 2025/04/22(火) 06:29:29.16 ID:OLfTS+ev
- LLMはハルシネーションがいちばん問題なのに
それが過去モデルより酷いんじゃ、本末転倒 - 10: 名無しのひみつ 2025/04/22(火) 07:22:06.98 ID:iY8sDINV
- 頭良くしたら平気でもっともらしい嘘をつくようになったってことだろ?
人間と同じじゃないw - 11: 名無しのひみつ 2025/04/22(火) 08:24:10.29 ID:E1wv/6dJ
- 4oとo4が紛らわしいんじゃ
- 12: 名無しのひみつ 2025/04/22(火) 08:27:04.21 ID:rPyN9OpS
- 夢の出来事を正当化するような認識機能がAIにも働いているんじゃないか?
- 19: 名無しのひみつ 2025/04/22(火) 11:55:47.96 ID:kN/QTrf5
- AIも人間に近くなると病気するんだろうね、
そのうち恋の病にかかるかも - 21: 名無しのひみつ 2025/04/22(火) 12:01:28.78 ID:ZZ5fKTwR
- AIも出力結果に「知らんけどw」と付加して回答するようになるのか
- 26: 名無しのひみつ 2025/04/22(火) 19:09:06.86 ID:AZiN/sa1
- ネット検索させると正確になるんだろ?
ネットが常に正しいわけでもないが
人間だってせいぜいネットで裏を取る位しかしない - 31: 名無しのひみつ 2025/04/22(火) 23:36:18.18 ID:s8Qqlz9e
- ファクトチェックにしか使えないのよ
- 32: 名無しのひみつ 2025/04/23(水) 00:12:19.88 ID:8IZZG0GA
- これって要するに成果出すことを強制すると捏造が増えるっていうことだろ
実質的に人間と同じでは? - 38: 名無しのひみつ 2025/04/23(水) 12:12:24.93 ID:vSMiz1Wv
- ただのバグをそれっぽく言うな
- 39: 名無しのひみつ 2025/04/23(水) 14:19:10.69 ID:vOiVUNKn
- chatGPTにハルシネーションについて聞いたら
質問の答えはファクトチェックしてない、AIはパターンで返答してるだけ
とかかなりシビアに答えてきたw
そのあたり調整された4.5に期待。