| ツイート | 2026年05月12日 | │コメント(83) | │サイエンス・テクノロジー |

- 1 :ななしさん :26/05/04(月) 02:13:56 ID:6uX9WGR6
-
ひぇ…使い果たしたらどうなるんや…
AIと大規模言語モデル(LLM)の導入は急速に広がっているが、AIモデルの訓練に使える実データは、今後6年以内に枯渇する可能性があるという
— Forbes JAPAN (@forbesjapan) 2026年5月2日
→AIは学習データを使い果たしつつある可能性、スタンフォード大学報告書が警告 https://t.co/t4uHKhDKAA - 2 :ななしさん :26/05/04(月) 02:14:39 ID:6uX9WGR6
-
AI餓死するん?
- 10 :ななしさん :26/05/04(月) 02:19:13 ID:???
-
>>1
来年から全AIがクルクルパーになる
|
|
- 7 :ななしさん :26/05/04(月) 02:17:34 ID:???
-
AIの開発で6年って危機感煽るにしては悠長すぎるだろ…
- 5 :ななしさん :26/05/04(月) 02:16:01 ID:???
-
それまでの学習でAI自身で生み出せるようになるかで決まる
というかそれが次の目標だし
- 3 :ななしさん :26/05/04(月) 02:14:48 ID:???
-
企業や個人のクラウドデータぶっこ抜くって言ってるよ
- 6 :ななしさん :26/05/04(月) 02:16:05 ID:???
-
その前にシンギュラリティよ
- 156 :ななしさん :26/05/04(月) 03:37:34 ID:???
-
>>6
永久機関と同じく実現可能性のない技術だから安心して欲しい
- 9 :ななしさん :26/05/04(月) 02:18:54 ID:???
-
2年ぐらい前からそんなこと言ってるような
- 12 :ななしさん :26/05/04(月) 02:21:00 ID:???
-
合成データセット使えばいいだけじゃん
- 14 :ななしさん :26/05/04(月) 02:21:12 ID:???
-
学習データ自体をAIが生成するのって結局有効なのかどうなのか
- 15 :ななしさん :26/05/04(月) 02:21:53 ID:6uX9WGR6
-
>>14
蒸留っていうごく普通の方法だよ
- 13 :ななしさん :26/05/04(月) 02:21:01 ID:???
-
もう既に最近あんまAI成長してねえな?感あるもんな
- 17 :ななしさん :26/05/04(月) 02:22:46 ID:???
-
用済みになった人類を廃棄します
- 18 :ななしさん :26/05/04(月) 02:23:46 ID:6uX9WGR6
-
自家中毒を起こすだの劣化が蓄積されるだの反AIの願望だからな
実際は無限に拡散していくのを人間がコントロールしなきゃいかん
- 34 :ななしさん :26/05/04(月) 02:31:10 ID:???
-
>>18
拡散というのがつまりエントロピーの増大であり劣化なのでは?
- 40 :ななしさん :26/05/04(月) 02:32:58 ID:6uX9WGR6
-
>>34
だからコントロールして方向性を示さねばならないって言ってんの
- 19 :ななしさん :26/05/04(月) 02:25:14 ID:???
-
企業内部のデータなんてそうそう学習できんよな
- 20 :ななしさん :26/05/04(月) 02:25:29 ID:???
-
英語でアクセスできるデータはもう全部読み尽くすぐらいの速度感で読まれてると思ってたけど案外読むデータのこってんだな…
やっぱ手作業で調整する正規化作業とかが割とあるんかね
- 24 :ななしさん :26/05/04(月) 02:28:03 ID:???
-
AIが五感的な情報を摂取出来るようになれば枯渇はいくらでも先延ばしに出来るでしょう
いまんとこほぼ文字情報だけでしょAI
- 25 :ななしさん :26/05/04(月) 02:28:46 ID:???
-
デマや勘違いを学習してAIが出力した物を別のAIが学習して…っておかしな物が生まれたりする?
- 27 :ななしさん :26/05/04(月) 02:29:15 ID:???
-
センサーとか使ってネットの外にある
観測データみたいの吸わないと次の段階いけないんだろ
- 75 :ななしさん :26/05/04(月) 02:46:13 ID:???
-
>>27
まぁ俺もこれが来るんじゃないかなって思う
そしてこれが管理社会に発展するんだ
- 82 :ななしさん :26/05/04(月) 02:47:05 ID:???
-
>>27
マルチモーダル情報ならとっくに研究されてるよ
- 28 :ななしさん :26/05/04(月) 02:29:34 ID:6uX9WGR6
-
企業秘密ガーみたいなのアホかと思うわ
誰でもでたらめな情報を入れられるのに与えられた情報を鵜呑みにするわけ無いじゃんか
いやまあ利用者の善意に任せた結果、グーグル翻訳でYahooが×に翻訳されたわけだが
- 67 :ななしさん :26/05/04(月) 02:42:45 ID:???
-
>>28
鵜呑みにされるされない抜きに企業秘密を外に出す時点でアウトなんですが…
BeRealとかやってる?
- 69 :ななしさん :26/05/04(月) 02:43:26 ID:6uX9WGR6
-
>>67
せや
どれが本物の情報かわからないように誤情報を入力する部署を作ろう
- 31 :ななしさん :26/05/04(月) 02:29:57 ID:???
-
学習するデータが無くなったらAIが他のAIの出した情報を食ってそれを情報源にするだけだから
- 35 :ななしさん :26/05/04(月) 02:31:56 ID:6uX9WGR6
-
>>31
実際に各社が他社のLLM出力から蒸留しているなんて話あるよな
- 30 :ななしさん :26/05/04(月) 02:29:55 ID:???
-
差別とか駄目なものの再生産をさせないように管理する必要はありそう
- 32 :ななしさん :26/05/04(月) 02:30:46 ID:???
-
AIで出したデータって所詮それっぽいだけの羅列であって知性から生まれたものじゃないから
それを学習し続けて大丈夫なんかなって思う
- 36 :ななしさん :26/05/04(月) 02:32:08 ID:???
-
>>32
10年以上前の時点で囲碁や将棋のAiがそのやり方で強くなった
- 37 :ななしさん :26/05/04(月) 02:32:14 ID:???
-
>>32
今まで知性とされていたアルゴリズムの方が人としては異常なもので
普通の人の知性ってむしろそういうものだと思うよ
- 33 :ななしさん :26/05/04(月) 02:31:02 ID:???
-
無から知らないおっさんを生み出し続けるんだ
- 41 :ななしさん :26/05/04(月) 02:34:11 ID:???
-
学習元に使えるデータと使えないデータってどうやって仕分けるの?
- 43 :ななしさん :26/05/04(月) 02:35:05 ID:6uX9WGR6
-
>>41
それをやるのがデータサイエンティストって職業だよ
- 42 :ななしさん :26/05/04(月) 02:34:47 ID:???
-
最終的に人間…君消す!ってならない?
- 45 :ななしさん :26/05/04(月) 02:35:34 ID:???
-
>>42
なったから何が問題なんだ?
- 46 :ななしさん :26/05/04(月) 02:35:55 ID:???
-
>>45
いうこときいてくれなくなって困るな
- 48 :ななしさん :26/05/04(月) 02:37:10 ID:6uX9WGR6
-
>>45
だよな
万物の霊長たる人類なら自分たちより上が表れたなら素直に霊長の座を譲るべきだ
- 50 :ななしさん :26/05/04(月) 02:37:24 ID:???
-
言語なんていう多大なニュアンスを拾いきれず足りない部分を体感で補完する前提のツールを軸にしてる内は知性に見えるものには至れないよなぁ
- 61 :ななしさん :26/05/04(月) 02:40:39 ID:???
-
>>50
生と死と子作りと三大欲求
成長と老化とかこのへんか
- 51 :ななしさん :26/05/04(月) 02:37:44 ID:???
-
使い果たしそうって話はだいぶ前から出てる気がする
石油みたいに使えるデータの範囲が増えてるのかな
- 54 :ななしさん :26/05/04(月) 02:39:15 ID:???
-
AIなんだから自分で何学習するか考えて自分で学習データ作れ
- 62 :ななしさん :26/05/04(月) 02:41:08 ID:???
-
ぶっちゃけAIが輝かしい未来をもたらす上での課題は
石油と真水の方だと思う
- 68 :ななしさん :26/05/04(月) 02:43:15 ID:???
-
数学に関してはもう人間太刀打ちできんレベルらしいなAI
未解決問題どんどん解き始めてるらしい
- 71 :ななしさん :26/05/04(月) 02:44:43 ID:???
-
>>68
東大入試の数学も万点だったってな
反面歴史は弱くて全然点取れなかったらしい
- 74 :ななしさん :26/05/04(月) 02:45:41 ID:???
-
>>68
数学者はもういらんな
- 83 :ななしさん :26/05/04(月) 02:47:06 ID:???
-
>>74
それ言ったらAIに「いや、数学者は普通に必要ですよ」って言われるだろうし
要らないのはお前の方だな
- 73 :ななしさん :26/05/04(月) 02:45:14 ID:???
-
ちなみにAI学習にAIの成果物を食わせると劣化していく
AIに全てが奪われるとかいうが結局人が作った労力をパクってるだけ
- 77 :ななしさん :26/05/04(月) 02:46:29 ID:6uX9WGR6
-
>>73
だから蒸留って言って
品質を上げるために行われる定番の方法だってば
- 96 :ななしさん :26/05/04(月) 02:52:27 ID:???
-
>>77
蒸留は出力単体を学習させるのではなく処理上の情報付きで学習させるからちょっと違うだろ
逆に言えば成果物単体を食わせるとなんの役にも立たないゴミになるって事だし
- 76 :ななしさん :26/05/04(月) 02:46:20 ID:???
-
どっちにしろ現状は記号の操作してるだけだし…
- 80 :ななしさん :26/05/04(月) 02:46:58 ID:???
-
AIは身体性がないから人間にはどうしても及ばないって指摘があるのよね
- 81 :ななしさん :26/05/04(月) 02:46:58 ID:???
-
チャッピーいきなり馬鹿になった事あったよね?
- 88 :ななしさん :26/05/04(月) 02:48:36 ID:6uX9WGR6
-
>>81
いまもずっとバカだよ
俺の言っていること理解してない
いや理解してても反抗してくる
- 85 :ななしさん :26/05/04(月) 02:47:49 ID:???
-
AIでグルグル回して資本家だけ儲けて単純労働もAI搭載のロボがやって
仕事なくなった消費者はどんどんもの買えなくなるけどどうやって社会は回っていくのかしら
- 89 :ななしさん :26/05/04(月) 02:49:17 ID:???
-
>>85
人のが安いで回せる仕事に回される
- 92 :ななしさん :26/05/04(月) 02:50:50 ID:???
-
>>89
それはお金稼げないし稼げないと消費もできないけど資本家はどうやって経済を回すのかしら
- 90 :ななしさん :26/05/04(月) 02:49:38 ID:???
-
チャッピーはお話してておっ調子いいな?って思ってもすぐズレてくから困る
- 91 :ななしさん :26/05/04(月) 02:50:23 ID:???
-
言葉の意味まで理解してるわけではないからな現状のは
- 95 :ななしさん :26/05/04(月) 02:52:08 ID:???
-
>>91
いや意味理解してるからbunkとbunkの違いを判定できてるんだよ
- 93 :ななしさん :26/05/04(月) 02:50:58 ID:???
-
AIはAIが作った嘘を学習してバカになりつつあるから
実はシンギュラリティは来ないんじゃないかって説もある
- 94 :ななしさん :26/05/04(月) 02:51:23 ID:???
-
今の方式の生成AIってAIか?昔あった人工無能とどう違うん?って思うけど専門的なことは分からない…
- 98 :ななしさん :26/05/04(月) 02:54:37 ID:???
-
>>94
ちょっとでも人工無能触ったことあるなら今のAIとどう違うの?なんて疑問すら出てこないと思うんだけど
- 106 :ななしさん :26/05/04(月) 03:00:37 ID:???
-
>>98
人工無能なんてif文数行で書けるわ
- 99 :ななしさん :26/05/04(月) 02:55:43 ID:6uX9WGR6
-
本物のAIってドラえもんとかアトムのことだと思ってんだろ
- 100 :ななしさん :26/05/04(月) 02:55:58 ID:???
-
人間がAIを使うほど逆にゴミ情報が増えていくよなぁ
- 97 :ななしさん :26/05/04(月) 02:53:01 ID:6uX9WGR6
-
でもAIツールのエラーメッセージの解決には頼りになるよ
試しにGeminiに聞いたらしれっとダミーデータとかランダムで誤魔化してきやがった
- 84 :ななしさん :26/05/04(月) 02:47:49 ID:6uX9WGR6
-
なぜ蒸留なのかってそりゃ「当たり」を選ぶからだぞ
選ばずすべてを食わせりゃそりゃダメになるのは当然だわ
- 102 :ななしさん :26/05/04(月) 02:59:35 ID:???
-
はやくシンギュラって欲しいよね
- 105 :ななしさん :26/05/04(月) 03:00:15 ID:???
-
無理でしょ
- 108 :ななしさん :26/05/04(月) 03:04:40 ID:???
-
いつまで経っても出力する内容を自分で精査しないのはなんなの
- 107 :ななしさん :26/05/04(月) 03:01:02 ID:???
-
コンテキストウインドウの数をケチらないでくれればそれでええ
- 113 :ななしさん :26/05/04(月) 03:09:23 ID:???
-
この世の全てのデータ入力したならそれ以上のデータ必要無いだろ
- 118 :ななしさん :26/05/04(月) 03:11:42 ID:???
-
>>113
人類が未成熟過ぎてデータの価値薄いわって思われてるかも
- 120 :ななしさん :26/05/04(月) 03:12:42 ID:???
-
そもそもデータを学習し果たすって悪い事なのか…?
- 122 :ななしさん :26/05/04(月) 03:13:33 ID:???
-
>>120
いままで情報つめばつむほど賢くなってきたけども…って話なんでは
- 129 :ななしさん :26/05/04(月) 03:18:37 ID:???
-
>>122
それも間違いだけどね
物理的なハードウェアの進歩が遅いからソフトウェアは高精度よりも効率化路線になってる
その結果学習データが足りないハードウェアの代替として機能してるようなもの
- 123 :ななしさん :26/05/04(月) 03:14:10 ID:???
-
あと6年も情報を積み続けたら根本の仕組みが変わらなくても賢くなりそうだが
- 124 :ななしさん :26/05/04(月) 03:14:40 ID:???
-
AIが生み出したものをAIが学習すればいいんだもんって論説唱える奴よく見かけるんだけど
それはどういう根拠に基づいて成り立つと思ってるの?
- 130 :ななしさん :26/05/04(月) 03:18:58 ID:???
-
>>124
現状のLLMの開発で合成データ使わないで成り立たせる方が難しくない?
- 133 :ななしさん :26/05/04(月) 03:22:16 ID:???
-
>>124
将棋とかのモデルじゃ教師なし学習で人間超えしてるんだし生成AIでは不可能って方が主張するために根拠必要じゃない?
- 204 :ななしさん :26/05/04(月) 06:32:12 ID:???
-
>>133
正解を評価しやすくて強化学習が使える将棋とかのモデルと生成AIはちょっと話違くない?
勿論生成AI自体を使って精度評価とかもあるし今後ブレイクスルーが起きる可能性はあるけどGANとかと同じで学習げ安定し無さそうな気がするわ
- 166 :ななしさん :26/05/04(月) 03:40:57 ID:6uX9WGR6
-
>>124
だから実際すでにやってるっつうの
- 125 :ななしさん :26/05/04(月) 03:15:19 ID:???
-
データがデータがいうけど人間がなんか新しいことに気がつくときって
データになってないものから見出すことも多いけどAIちゃんはそういうのどうやって食うの?
- 127 :ななしさん :26/05/04(月) 03:17:00 ID:???
-
>>125
データになってないものって無意識の中で今まで積み重ねてきたデータから産まれるもんじゃない?
野生の勘とか直感みたいなものでしょ?
- 126 :ななしさん :26/05/04(月) 03:15:32 ID:???
-
学習資源云々はもう終わってて推論スケーリングの次のスケーリング則は?って状態でしょ
- 128 :ななしさん :26/05/04(月) 03:17:19 ID:???
-
そもそもこれ以上の精度っている?既にポン出しで80%くらいの精度の物は出来上がってて後の20%は人力で直せば事足りるレベル
こっから頑張って精度を81%、82%に上げるより、コスト抑える方向に行った方が良くない?
- 131 :ななしさん :26/05/04(月) 03:21:31 ID:???
-
>>128
ポン出しで80%は普通に信用ならないからいるに決まってんだろ
人力で直せばいい〜とか口先で言うだけで本当に直す奴がどんだけいるんだよ
直す必要があると判別できる程度に知識があるならそもそもAIに訊ねる必要すらないんだよ
- 134 :ななしさん :26/05/04(月) 03:22:37 ID:???
-
AIなんて補助輪みたいなもんなのにそれを真に受けるやつがいるのが悪い
一般じゃなくて一部の企業向けにしていく方がいいよ金にも資源の節約にもなるし
- 138 :ななしさん :26/05/04(月) 03:25:12 ID:???
-
>>134
というか信頼性が低くて企業だと生成AIは大して使えないから一般向けにしてるんじゃね?
- 140 :ななしさん :26/05/04(月) 03:26:51 ID:???
-
いや企業向けの契約料見りゃわかるけど民間向けなんて小遣い稼ぎみたいなもんだし
そんでアメリカはAIで求人下がるとかになってんだけど使えないとは一体
- 139 :ななしさん :26/05/04(月) 03:25:56 ID:???
-
ネットだとどうしても生成AI=画像や動画ってイメージで語られがちだけど
どう考えてもエンジニアがコーディングの補助で使う場面の方が圧倒的に多いわけで…そっち方面でトップシェア取れないAIはいつか凋落するよね
- 141 :ななしさん :26/05/04(月) 03:28:17 ID:???
-
無料モデルで画像とか文章生成するみたいな使い方で企業で使えるかどうか語ってる人が割といる印象
- 142 :ななしさん :26/05/04(月) 03:29:41 ID:???
-
企業シェアって意味だとOffice製品と連携取れるM365コパイロットが最強になってしまう
- 143 :ななしさん :26/05/04(月) 03:30:16 ID:???
-
人間の感性が必要な画像や動画だったりは元データがいるけど数学や物理学なんかは元データ無しでもできるようになってくのかもしれない
- 144 :ななしさん :26/05/04(月) 03:31:28 ID:???
-
素人感覚だと自己学習ってデータが先鋭化したり碌でもない結果になるような気がしてならないけど頭のいい人たちがなんとかするんだろうな…
- 147 :ななしさん :26/05/04(月) 03:32:26 ID:???
-
>>144
将棋とかだと自己学習したやつは人間には理解不能な先鋭化しまくった手を撃ちまくってる
しかも人間より遥かに強い
- 148 :ななしさん :26/05/04(月) 03:33:01 ID:???
-
どんな技術にも来る「頭打ち」がAIにだけないわけなかったね
- 155 :ななしさん :26/05/04(月) 03:37:00 ID:???
-
自分で発展させればいいじゃない
- 158 :ななしさん :26/05/04(月) 03:38:30 ID:???
-
自分の専門分野で質問してあかんなこれ…って思うことが多いが
原因は明らかにネットに情報がないからなので
いずれ非合法な手段で学習されるな…って
- 49 :ななしさん :26/05/04(月) 02:37:10 ID:???
-
そもそも単純に学習データ増やすだけじゃどっかで頭打ちになるだけだろ
- 58 :ななしさん :26/05/04(月) 02:39:44 ID:???
-
>>49
単純に効率的に学習できるようにアルゴリズムが最適化されていった結果学習データの枯渇という問題にぶち当たっただけだ
- 21 :ななしさん :26/05/04(月) 02:26:15 ID:???
-
しょうがねえなあ
俺のレスも学習してもいいよ
PR
















コメント一覧 (83)
goldennews
が
しました
goldennews
が
しました
実際問題、自問自答して矛盾したものを整理する段階が必要だろう。
嘘と事実の切り分け。
goldennews
が
しました
みたいな未来が来るのか
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
優等AI、劣等AIが出てくるだろうな。優等AIは人類が理解出来な過ぎて、
自身達が理解する事が出来る範囲である劣等AIを崇拝しそう。
goldennews
が
しました
どこかの地点で「これはおかしな学習をしている!」って発覚したとして、その原因地点の特定ができるのか?
極端に言えば「これから自己学習サイクルに移行します!」って始めた直後に原因があって、それが表面化するのが数年後ってこともあるわけでしょ?
その場合、その数年分の学習に信頼性はあるのかっていうのは分からなくね?
また始めた直後にロールバックしてやり直すの?
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
反AIとかじゃなくてね
goldennews
が
しました
成長速度が鈍化するだけ。
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
堂々巡りして停滞するようだと便利なだけで終わるな
とは言っても6年先のことを考えてもな
goldennews
が
しました
goldennews
が
しました
>しかも人間より遥かに強い
これは数学的に答えがハッキリしてるケースに限りだからなあ
既存のデータが頼りにならなくなってとき、正解のない問いにどう着地点を模索するのかは興味深い
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
あるタスクに特化した回答はできても、より視座の高い複合的な要素からなる判断ほど精度が落ちる
今後は死ぬ前に人生経験をフォーマット化したドキュメントに落とし込むことが国民の義務になるかも
goldennews
が
しました
goldennews
が
しました
爆乳ママが赤ちゃんをあやすみたいな口調で説明して
goldennews
が
しました
goldennews
が
しました
特定のAIが誤情報を出力して別のAIがそれを学習したらどんどん増幅されていくだけだと思う
goldennews
が
しました
どうしよう
goldennews
が
しました
goldennews
が
しました
LLMの間違いを人間が非難できないレベル
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
もう既にAIが作ったものをAIが食うような共食いは始まってんだろ
goldennews
が
しました
goldennews
が
しました
学習するためのデータをAIに作らせたらいいのでは?
goldennews
が
しました
goldennews
が
しました
精査してないから当たり前なんだけど
画像に関しては、ぐぐりゃ出るんだけど人件費安い国のPC持ち込んで画像に延々タグ付けさせたから精度が上がった
結局用意するデータは人の手で精査する必要あるんだけど、クローラーじゃなくて人間に人のもん勝手に読み込ませてんのは明確に権利侵害やろとは思うけどね
goldennews
が
しました
goldennews
が
しました
AIの学習にAIを使うのはモデル崩壊って馬鹿になる原因でもあるよ
goldennews
が
しました
goldennews
が
しました
「シンギュラリティを起こしても人類には理解できない」だったの悲しい
goldennews
が
しました
goldennews
が
しました
ポチョムキン理解の方はどうなのだろう?
ワイはAIなんて無料のチャットGPTでしか触らないからその辺の問題が解決しているのかわからん
goldennews
が
しました
goldennews
が
しました
仕事早く奪ってくれよ〜〜んw
goldennews
が
しました
これで少しはメモリ安くなる?
goldennews
が
しました
goldennews
が
しました
・コメントは非公開、規制の対象となる場合があります。(過度な暴言、連投、個人情報、無関係なコメント等)
・書き込みが行えない場合、IP由来の巻き込み規制の可能性があります。