1: すらいむ ★ 2025/04/21(月) 23:33:55.89 ID:+A5e8kSG
OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明

 OpenAIは2025年4月16日に、新しい推論モデルの「o3」と「o4-mini」を発表しました。
 同社は特にo3を「OpenAI史上最も高度な推論モデル」と位置づけていますが、同時にリリースされた技術レポートと独立した外部調査により、両モデルがGPT-4oなどの従来モデルよりも幻覚(ハルシネーション)を起こしやすい傾向があり、OpenAIはその原因を把握できていないことが示されました。

 OpenAI o3 and o4-mini System Card
 (PDFファイル)https://cdn.openai.com/pdf/2221c875-02dc-4789-800b-e7758f3722c1/o3-and-o4-mini-system-card.pdf

(以下略、続きはソースでご確認ください)

Gigazine 2025年04月21日 14時00分
https://gigazine.net/news/20250421-openai-hallucinate-o3-o4-mini/

引用元: ・【AI】OpenAIの「o3」と「o4-mini」は従来のAIよりも「幻覚」を起こしやすいことが判明 [すらいむ★]

6: 名無しのひみつ 2025/04/22(火) 04:28:49.42 ID:O+vnwDaT
省エネ性能に優れるってことは、つまり「深く考えない」ってことw
「いいやテキトーに答えとけ」ってなもんよw
7: 名無しのひみつ 2025/04/22(火) 06:29:29.16 ID:OLfTS+ev
LLMはハルシネーションがいちばん問題なのに
それが過去モデルより酷いんじゃ、本末転倒
10: 名無しのひみつ 2025/04/22(火) 07:22:06.98 ID:iY8sDINV
頭良くしたら平気でもっともらしい嘘をつくようになったってことだろ?
人間と同じじゃないw
11: 名無しのひみつ 2025/04/22(火) 08:24:10.29 ID:E1wv/6dJ
4oとo4が紛らわしいんじゃ
12: 名無しのひみつ 2025/04/22(火) 08:27:04.21 ID:rPyN9OpS
夢の出来事を正当化するような認識機能がAIにも働いているんじゃないか?
19: 名無しのひみつ 2025/04/22(火) 11:55:47.96 ID:kN/QTrf5
AIも人間に近くなると病気するんだろうね、
そのうち恋の病にかかるかも
21: 名無しのひみつ 2025/04/22(火) 12:01:28.78 ID:ZZ5fKTwR
AIも出力結果に「知らんけどw」と付加して回答するようになるのか
26: 名無しのひみつ 2025/04/22(火) 19:09:06.86 ID:AZiN/sa1
ネット検索させると正確になるんだろ?
ネットが常に正しいわけでもないが
人間だってせいぜいネットで裏を取る位しかしない
31: 名無しのひみつ 2025/04/22(火) 23:36:18.18 ID:s8Qqlz9e
ファクトチェックにしか使えないのよ
32: 名無しのひみつ 2025/04/23(水) 00:12:19.88 ID:8IZZG0GA
これって要するに成果出すことを強制すると捏造が増えるっていうことだろ
実質的に人間と同じでは?
38: 名無しのひみつ 2025/04/23(水) 12:12:24.93 ID:vSMiz1Wv
ただのバグをそれっぽく言うな
39: 名無しのひみつ 2025/04/23(水) 14:19:10.69 ID:vOiVUNKn
chatGPTにハルシネーションについて聞いたら
質問の答えはファクトチェックしてない、AIはパターンで返答してるだけ
とかかなりシビアに答えてきたw