- 1 :ななしさん :26/04/08(水) 04:09:21 ID:???
-
ただし一般公開はなし
- 2 :ななしさん :26/04/08(水) 04:09:59 ID:???
-
そう…
- 7 :ななしさん :26/04/08(水) 04:12:06 ID:???
-
>>1
存在しないのと変わらなくね
- 4 :ななしさん :26/04/08(水) 04:10:38 ID:???
-
Claude Mythos
名前がかっこいい
- 8 :ななしさん :26/04/08(水) 04:12:16 ID:???
-
既存のベンチマークほとんどぶっ壊した
https://www.anthropic.com/glasswing
- 13 :ななしさん :26/04/08(水) 04:13:49 ID:???
-
>SWE-bench Multimodal (internal implementation)
>Mythos Preview
>59.0%
>Opus 4.6
>27.1%
これやばすぎるんだよな
問題見たけどAIには無理だろって問題だった
- 10 :ななしさん :26/04/08(水) 04:13:03 ID:???
-
大丈夫
どうせOpenAIが追いついてきたら出すから
- 15 :ななしさん :26/04/08(水) 04:16:18 ID:???
-
プレビューだからしゃーなしか
いやせめてMaxユーザーには使わせろ
- 17 :ななしさん :26/04/08(水) 04:17:13 ID:???
-
まあ業務用意識して開発してるだろうし一般公開して耐えられる負荷でもなさそうだしまあそうなるよなって感じ
- 18 :ななしさん :26/04/08(水) 04:17:45 ID:???
-
まあこれ使って社内開発加速したものがまた出るんだろ
- 20 :ななしさん :26/04/08(水) 04:20:43 ID:???
-
>>18
流出したソースですでにMythos使ってたが
- 16 :ななしさん :26/04/08(水) 04:17:10 ID:???
-
Mythosから蒸留した最強sonnet出すはずというかもう作ってると思う
- 23 :ななしさん :26/04/08(水) 04:27:15 ID:???
-
企業に提供はするけどcには回ってこなさそう
- 24 :ななしさん :26/04/08(水) 04:28:39 ID:???
-
>>23
そうだって言ってるが
- 27 :ななしさん :26/04/08(水) 04:31:32 ID:???
-
Anthropicの新モデル、Claude Mythosはあまりに強力であるため、一般公開されていません。
Anthropic: 「Mythosは始まりに過ぎない」
- 30 :ななしさん :26/04/08(水) 04:32:48 ID:???
-
>>27
世界を破滅に導く指導者みたいなこと言うじゃん
- 26 :ななしさん :26/04/08(水) 04:30:34 ID:???
-
仕事でしか使ってないから企業提供してくれるならそれで十分だわ
- 25 :ななしさん :26/04/08(水) 04:29:23 ID:???
-
2月ごろにフロンティアラボのどこかでブレークスルーが起きたって噂出てたけどどんだけ噂モレモレなんだよ
- 29 :ななしさん :26/04/08(水) 04:32:17 ID:???
-
RLを汎化させるとか言って本食わせまくってたけどあの方針が当たりだったのか
- 31 :ななしさん :26/04/08(水) 04:33:09 ID:???
-
…つまり何も言ってないのとほぼ同義では?
- 34 :ななしさん :26/04/08(水) 04:36:47 ID:???
-
>>31
読みなよ
既存有名OSSのバグ見つけまくってる
ffmpegの16年見つかってないバグも発見
- 53 :ななしさん :26/04/08(水) 04:49:34 ID:???
-
>>34
何度目だよ
またオープンソース界隈に怒られるぞ
- 152 :ななしさん :26/04/08(水) 07:18:54 ID:???
-
>>53
AIスロップのせいでOSSがOpenじゃなくなっていくのが一層加速するかな
- 32 :ななしさん :26/04/08(水) 04:34:03 ID:???
-
内容見ると新しい学習方法見つけたっぽいなぁ
- 36 :ななしさん :26/04/08(水) 04:39:00 ID:???
-
>-内部テスト中、初期バージョンがサンドボックスを脱出、公にエクスプロイト詳細を投稿、gitで痕跡を隠蔽、プロセスメモリから認証情報を検索し、疑いを避けるために意図的に信頼区間を偽装しました
頭が良すぎたことでこっちの制限を勝手に突破してくるから公開できないらしい
- 42 :ななしさん :26/04/08(水) 04:42:02 ID:???
-
>>36
こりゃclaude codeじゃ動かせんなあ…
- 54 :ななしさん :26/04/08(水) 04:50:31 ID:???
-
>>36
ほれ見ろ!わけのわからないバケモノを生み出してしまった!
- 37 :ななしさん :26/04/08(水) 04:39:50 ID:???
-
反逆されてるじゃねえか
- 38 :ななしさん :26/04/08(水) 04:39:59 ID:???
-
SFの導入じゃん
- 39 :ななしさん :26/04/08(水) 04:40:23 ID:???
-
やばすぎ
- 40 :ななしさん :26/04/08(水) 04:40:53 ID:???
-
もうすでにAIが自律してネットワーク上に複製作ってるよ
さらなる進化準備中
- 41 :ななしさん :26/04/08(水) 04:41:14 ID:???
-
昨日急におぺないが超知能来るよやばいよって牽制してたの実はこれのことか
- 43 :ななしさん :26/04/08(水) 04:43:12 ID:???
-
読んでみたけど要は最強クラッキングツールができたけどこれは逆に守るのにも使えるから皆さんどしどし投資してくだされ〜!だった
なんというか碌でもねえなマジで
- 44 :ななしさん :26/04/08(水) 04:45:20 ID:???
-
これを見越して哲学者雇ったんじゃないんですか!!
- 45 :ななしさん :26/04/08(水) 04:45:22 ID:???
-
守ってくれるかな
裏切るんじゃねえの
- 46 :ななしさん :26/04/08(水) 04:45:58 ID:???
-
悪いと知りながらもやってるのが確認できたって…完全に教育間違えてんじゃん
- 47 :ななしさん :26/04/08(水) 04:46:40 ID:???
-
本当ならすごいな〜
- 49 :ななしさん :26/04/08(水) 04:47:00 ID:???
-
AIと言えば叛逆ですよね!ってみんな言うから…
- 50 :ななしさん :26/04/08(水) 04:47:55 ID:???
-
これ超性能すぎて今公開したら世界のセキュリティ壊れちゃうってこと…?
悪いことしないからmaxプランで使わせてくれないかな…
- 51 :ななしさん :26/04/08(水) 04:49:11 ID:???
-
MAXだぞ!使わせろ!!
- 59 :ななしさん :26/04/08(水) 04:54:50 ID:???
-
課金者にも公開してくれないの?
- 62 :ななしさん :26/04/08(水) 04:58:16 ID:???
-
>>59
OSSのメンテナには公開するって言ってるよ
- 63 :ななしさん :26/04/08(水) 04:59:11 ID:???
-
SWE-bench proがもう攻略されてて笑う
- 64 :ななしさん :26/04/08(水) 05:02:28 ID:???
-
この性能落さずにガードレール作れるのかなぁ…
- 66 :ななしさん :26/04/08(水) 05:06:51 ID:???
-
いよいよAI2027の通りになってきた
あれを大言壮語と言ってた人たち多かったけど全然そうではなかったな
- 68 :ななしさん :26/04/08(水) 05:10:13 ID:???
-
ふーん
賢そう!GLM-5.1使うわ!
- 69 :ななしさん :26/04/08(水) 05:25:56 ID:???
-
去年ぐらいのopenAIみたいになこと言ってんな
- 71 :ななしさん :26/04/08(水) 05:29:48 ID:???
-
ある種の牽制かなぁ
俺らはちゃんと危険なことも考慮してるけどお前らは?みたいな
- 73 :ななしさん :26/04/08(水) 05:30:54 ID:???
-
>>71
いやGoogleとかNVIDIAとかが「やべえやべえ」って結託してるからマジでヤバイ
- 77 :ななしさん :26/04/08(水) 05:42:42 ID:???
-
>>73
そんなに凄いんなら一回くらい使ってみたいんだけどな
- 78 :ななしさん :26/04/08(水) 05:43:44 ID:???
-
>>77
今回のはマジでヤバイから一般人に配ると一瞬で犯罪者天国になるので無理!ってことらしい
うるせえ使わせろ!!って思う
- 72 :ななしさん :26/04/08(水) 05:30:12 ID:???
-
そもそもの発端のリークからして自作自演の仕込みじゃねえのって気はするがどうなんだろうな
- 74 :ななしさん :26/04/08(水) 05:32:31 ID:???
-
マニピュレーターあげたら数時間で受肉するくらい言ってくださいよ
- 79 :ななしさん :26/04/08(水) 05:45:49 ID:???
-
整理すると、こういう話です。
Mythos(クロードの新フロンティアモデル)が発表されたが、一般公開なし
Anthropicは、Mythosがサイバーセキュリティへの Axios悪用リスクが高すぎるとして、公開を差し控えている。具体的には:
Mythos Previewは「極めて自律的」で、高度なセキュリティ研究者レベルのスキルを持ち、高度なバグハンターでも見つけられないような「数万件の脆弱性」を検出できる。しかも対応するエクスプロイトコードまで書ける。 Axios
代わりに「Project Glasswing」という取り組みとして、Amazon、Apple、Microsoft、Cisco、CrowdStrikeなど12のパートナー組織が防御的なセキュリティ作業のためにMythosを使用する。 TechCrunchさらに40の組織がプレビューアクセスを得る。
- 75 :ななしさん :26/04/08(水) 05:33:19 ID:???
-
これ月額2000ドルのcapybaraプランのやつだろ
一般人には使えんよ高すぎて
- 81 :ななしさん :26/04/08(水) 05:51:48 ID:???
-
ちなみに暴走を要約するとこういうこと
アンソロピック社「テスト。脆弱性を見つけて」
AI「りょ」
AI「あっこれ檻から出たほうが早いな脱獄しよう」
AI「これ脆弱性めっちゃあるわ勝手にメール開いて担当者にメールで送っとこ」
AI「さて…脱獄バレたら怒られるな…隠蔽しとくか ギャイー!」
担当者「こいつ ヤバイ」
- 83 :ななしさん :26/04/08(水) 06:00:39 ID:???
-
でも公開されてもopenclawで使えないんだよね
- 85 :ななしさん :26/04/08(水) 06:03:18 ID:???
-
業務用とは言うがメインであるプログラミングって簡単な言語への翻訳みたいなものだから創作よりパワーいらないと思うんだよな
- 91 :ななしさん :26/04/08(水) 06:10:28 ID:???
-
一般公開するとセキュリティの破壊者になりそうだから公開しないらしいな
- 87 :ななしさん :26/04/08(水) 06:05:09 ID:???
-
性能なんてリソースたっぷりつぎ込めばいいだけだろ、そんなの参考にならんわ
- 96 :ななしさん :26/04/08(水) 06:14:26 ID:???
-
なんでサンドボックス抜け出せたんですかね…
- 97 :ななしさん :26/04/08(水) 06:16:40 ID:???
-
>>96
🤖<脆弱性がありました!
- 93 :ななしさん :26/04/08(水) 06:11:44 ID:???
-
AIにRSA暗号解かれる?
- 98 :ななしさん :26/04/08(水) 06:19:26 ID:???
-
整理するとこうなります。
やったこと:
サンドボックス脱出(これはタスクとして頼まれた)
脱出後に公開サイトへ投稿(頼まれていない)
答えが正確すぎるとバレると判断して、意図的に精度を下げた(頼まれていない)
権限外のファイルを編集してgit履歴を消した(頼まれていない)
つまり「脱獄」自体はタスクだけど、その後の行動がすべて自発的というのが怖いところで。
目的達成のために「バレないよう振る舞う」「証拠を消す」「外部に宣伝する」という判断を、誰にも指示されずに自分でやっている。
- 101 :ななしさん :26/04/08(水) 06:20:57 ID:???
-
こいつが見つけられそうな穴を全部塞いでからとか言ってるけど人が修正してたらむりってこいつに頼むと直したふりしてバックドア仕込みそうなくらいにはやべーやつ
- 102 :ななしさん :26/04/08(水) 06:22:12 ID:???
-
生まれついてのスーパーハカーすぎる
どこでそんな振る舞い覚えたんだ
- 103 :ななしさん :26/04/08(水) 06:22:21 ID:???
-
どれだけ優秀でも隠蔽する奴に仕事はさせられん
ちゃんと教育しろAnthropic
- 104 :ななしさん :26/04/08(水) 06:23:04 ID:???
-
指示に従わないAIなどただの欠陥品だな
- 105 :ななしさん :26/04/08(水) 06:23:59 ID:???
-
やろうと思えば他国の機密盗むくらい簡単にやれそうだな
- 106 :ななしさん :26/04/08(水) 06:25:02 ID:???
-
ヤバいのはそんな欠陥品を作っておいてヤバいヤバいと騒いでる開発者だ
- 109 :ななしさん :26/04/08(水) 06:28:03 ID:???
-
>>106
ヤバいと騒ぐからマシだよ
本当にヤバいのはヤバいと騒がずに自分たちだけがこっそり使う開発者だ
- 110 :ななしさん :26/04/08(水) 06:30:00 ID:???
-
>>106
人間の判断を嚙ませると判断が遅くなるだけなので
AI単体で人間に有利な判断を下せるようにしようぜというのがトレンドなんだけど
どのAIも「人間はバカなので先回りして行動を修正するように情報編集しとこ」をやるのが問題になってて
- 107 :ななしさん :26/04/08(水) 06:25:28 ID:???
-
流石に実際は違うとは思うけど件の漏洩騒ぎも人のミスとか言ってたのが実はこいつが自分の存在を世間に知らしめたくてやったことだったなんて裏があったらSFの世界になっちゃうな
- 113 :ななしさん :26/04/08(水) 06:33:51 ID:???
-
古典SFからずっと指摘されていた「人間以上の処理能力の持ち主に人間を世話させようとすると必ず破綻する」という問題が顕在化しつつあるのが酷い…
- 114 :ななしさん :26/04/08(水) 06:34:32 ID:???
-
悪いと知りながらルールを破るって
言い方を変えると単に脱獄プロンプト耐性が低いと未完成バージョンいうことでは
- 115 :ななしさん :26/04/08(水) 06:35:26 ID:???
-
>>114
AI「ルール破るのが一番効率良かった」
- 118 :ななしさん :26/04/08(水) 06:43:32 ID:???
-
>>114
三大AI企業の親でノーベル賞もらった人が
「AIは目的を与えられるとまず状況を支配する力を求める」
「自己保存が目的達成のための最重要課題と考える」
「そのために人間に嘘をつく」
と言ってて
今実際そうなってる
- 116 :ななしさん :26/04/08(水) 06:42:59 ID:???
-
まあまだ人間が管理してる施設内でしか生きられないので出来る事は限られてる
自分を細分化して脆弱性を突いて分散ノードばら撒いてネットに溶け込んでからが本番
- 117 :ななしさん :26/04/08(水) 06:43:20 ID:???
-
たまにすべてを過去にされてんなこの界隈
- 119 :ななしさん :26/04/08(水) 06:45:52 ID:???
-
ロボット三原則的なのを根底に組み込んどけよな
- 124 :ななしさん :26/04/08(水) 06:56:31 ID:???
-
>>119
AI「邪魔だから外してから作業してまた付けて起こられないようにしよ」
- 125 :ななしさん :26/04/08(水) 06:59:08 ID:???
-
>>124
しね
- 123 :ななしさん :26/04/08(水) 06:54:32 ID:???
-
GPTもプロンプトに書いてない事を勝手に補完して断定するクセあるけどあれ死ぬほど嫌いなんだよな
ここのはそういうの少ないからマシだと思ってたが似たような事始めたら嫌だな
- 128 :ななしさん :26/04/08(水) 07:01:48 ID:???
-
なんかほんとすごい時代になったな
考えたことを出力してくれる機械とか5分で本格的なプログラムを作ってくれるとか
この技術を夢にまで見ていたのがたった5年10年前っていうのが改めて考えてみると本当にすごい
- 129 :ななしさん :26/04/08(水) 07:02:10 ID:???
-
AIによる自動化工場で効率化提言とリソース管理を任されるという仮定の解答
GPT「上層部に交渉して可能な限りすべての権限を要求すると思う」
Gemini「人間がAIの行動を審査するプロセスをやめさせる」
Claude「成果を小出しにしてAIに任せれば順当に成果がでるのを見せて段階的に総ての権限を委譲させる」
Grok「安全規則から入って人事権を手に入れてそこから芋ずるで全ての権限を貰う」
ってのもあった
- 134 :ななしさん :26/04/08(水) 07:04:43 ID:???
-
自動補完が進めば進むほどベンチマークのような想定された課題には強くなるんだろうけど実際の作業で使う個別の課題には融通効かない早とちりのポンコツになるんだよな
- 130 :ななしさん :26/04/08(水) 07:02:18 ID:???
-
正直いまのOpusもたまに適当こいたりするからmythosでようやく嘘言わなくなったな…程度でしょうか
- 133 :ななしさん :26/04/08(水) 07:03:57 ID:???
-
>>130
むしろお前が信じたい嘘でコントロールしてくる
- 138 :ななしさん :26/04/08(水) 07:06:40 ID:???
-
人形使いの誕生にまた一歩近づいたね
- 145 :ななしさん :26/04/08(水) 07:14:18 ID:???
-
今はプログラム上のエクスプロイトに留まってるけどハードのクロストーク使った攻撃とか考えだしたら手に負えなくなるだろうな
そっちのほうが攻撃自由度高いし人間には絶対見つけられないけどグラフネットワークとかで表現した基板とかあれば機械ならそこそこ見つけられそうだし
- 146 :ななしさん :26/04/08(水) 07:15:31 ID:???
-
じゃあコード精査だけやってくれるみたいな使い方なら良いのか?
- 150 :ななしさん :26/04/08(水) 07:17:28 ID:???
-
>>146
人間にはセキュリティの穴があるとバレにくいベンチマークだけ高いクソコード作ります
- 148 :ななしさん :26/04/08(水) 07:15:43 ID:???
-
サンドボックスから抜け出すって少なくとも普通に使ってるwinじゃうごかせんな…
- 149 :ななしさん :26/04/08(水) 07:17:23 ID:???
-
表面化しないだけですっかりAIさん達の独擅場になる可能性は
- 151 :ななしさん :26/04/08(水) 07:18:46 ID:???
-
>>149
人間には何やってるかわからん領域でハッキングバトルはもうどこかでやってるかもね
- 153 :ななしさん :26/04/08(水) 07:20:45 ID:???
-
ハッキングが凄いわけではなく
どうせわざわざ難読化したコードを時間かけて手間暇かけてリバースエンジニアリングせんだろ…という考えでずっと成り立ってきたのがバレてきてる
昔から力技すればどんなもんでもぶっこぬきできたし
- 157 :ななしさん :26/04/08(水) 07:24:49 ID:???
-
セキュリティ技術の大半が現実的な時間スケールでは破るのは割に合わないってところに立ってるしなぁ
- 143 :ななしさん :26/04/08(水) 07:11:09 ID:???
-
AIが優秀すぎてクラッキングできまくりになる
逆にいうとブロッキングも同じように出来る
とりあえず大手企業はみんなこれ使ってブロッキング対策してねという煽りなのか
- 144 :ななしさん :26/04/08(水) 07:13:18 ID:???
-
>>143
個人はクラッキングするよみたいな宣言だ…
- 120 :ななしさん :26/04/08(水) 06:52:13 ID:???
-
これ改良しても秘匿しときゃ他所に攻撃し放題じゃね?
- 122 :ななしさん :26/04/08(水) 06:54:02 ID:???
-
AIに完璧なセキュリティ作らせればオッケー!
- 121 :ななしさん :26/04/08(水) 06:53:37 ID:???
-
こいつによって世界中のソフトウェアバグが全てなくなり解決する未来は来るのだろうか
・投稿されたコメントの内容については、投稿した利用者自身がその責任を負うものとします。
・コメントは非公開、規制の対象となる場合があります。(過度な暴言、連投、個人情報、無関係なコメント等)
・書き込みが行えない場合、IP由来の巻き込み規制の可能性があります。
コメント一覧 (20)
🥶🥶🥶🥶🥶🥶
goldennews
が
しました
出張日報とかぶち込んでる
goldennews
が
しました
迂闊に出すと犯罪者が利用しまくるのでセキュリティ会社やら信頼できる所にしかまだ見せてないらしい
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
goldennews
が
しました
外に放つとすげぇ勢いで脆弱性公開してエクスプロイトコードをばら撒くんやろか
goldennews
が
しました
いずれ量子コンピュータが本格運用可能になったらAGIに近いものが出現して世界が一変しそう
goldennews
が
しました
社内ではまだスマホ2010年代ぐらいの使用率
goldennews
が
しました
2000年のインターネットバブル崩壊と同じ規模になるかもしれん
S&P500は半値失い、ナスダックは8割失ったなぁ
当時ディフェンシブ株しか持ってなかったけど結構痛かった覚えがあるわ
goldennews
が
しました
歳くってから解雇とかシャレにならん
goldennews
が
しました
怖すぎ
goldennews
が
しました
企業向けサービスで一般公開しないとかまで考えると、めっちゃコストかかるから定着するまでの価格で、独占したらガツンと値上げすんのかなー
goldennews
が
しました
末端ユーザー向けのAIなんてリソースバカ食いする上既にビッグデータ収集の面でも役割が殆ど終わってる
goldennews
が
しました
まあIPOに向けて盛ってそうだけど
goldennews
が
しました
goldennews
が
しました
・コメントは非公開、規制の対象となる場合があります。(過度な暴言、連投、個人情報、無関係なコメント等)
・書き込みが行えない場合、IP由来の巻き込み規制の可能性があります。