トップに戻る

セキュリティ

記事数: 238
AI ハッキングが工業規模化——Google が警告、パッチから悪用まで最短 30 分
更新

AI ハッキングが工業規模化——Google が警告、パッチから悪用まで最短 30 分

Google の threat intelligence チームが、AI を使用したサイバー攻撃が 3 ヶ月で急速に進化し、犯罪グループが言語モデルを使用して脆弱性を即座に悪用できるようになったと報告。従来の 90 日セキュリティディスクロージャーモデルは機能停止状態に。

続きを読む
Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Anthropic、Claude Mythos Preview が月間10,000件以上の脆弱性を検出——「修正追いつかず」の危機的状況を警告

Project Glasswing での実績を公開。Claude Mythos Preview がシステム関連ソフトウェアから1ヶ月間で10,000件以上の高・重大度脆弱性を特定。一方、修正速度は検出ペースに追いつかず、セキュリティ業界の新たな課題として浮上している。

続きを読む

Ocean、AI フィッシング対策のエージェント型メールセキュリティで $28M 調達——元 Iron Dome 研究員の起業

イスラエルのサイバーセキュリティ専門家 Shay Shwartz が創設した Ocean が、Lightspeed Venture Partners からの主導で $28M のシリーズ調達に成功。LLM ベースのカスタム言語モデルで AI 駆動型フィッシング攻撃に対抗する企業向けメールセキュリティプラットフォーム。

続きを読む
OpenAI が Google の SynthID 採用・C2PA 標準推進、AI 画像検証を業界標準化へ

OpenAI が Google の SynthID 採用・C2PA 標準推進、AI 画像検証を業界標準化へ

OpenAI が Google 開発の SynthID ウォーターマーク技術を製品に統合し、C2PA メタデータ標準にも対応。Nvidia・Google との連携で、AI 生成画像の信頼性検証が業界スタンダード化。フェイク対策の重要度が一気に高まる。

続きを読む
Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

Cloudflare、Anthropic's Mythos Preview で複雑な脆弱性チェーンを検出——「以前のモデルが見逃したもの」

Cloudflareが自社の50以上のコードリポジトリで Mythos Preview をテスト。複数の脆弱性を組み合わせた実行可能な攻撃チェーンを特定でき、他のフロンティアモデルより精度が高いことが判明しました。

続きを読む
GPT-5.5 が Claude Mythos と同等のサイバー攻撃能力を実証——AISI テストで性能並行
更新

GPT-5.5 が Claude Mythos と同等のサイバー攻撃能力を実証——AISI テストで性能並行

OpenAI の GPT-5.5 が Anthropic の Claude Mythos と同程度のサイバー攻撃成功率を示した。英国 AI 安全機構(AISI)の最新評価で、両モデルとも 70% 前後の成功率でエンタープライズネットワークへの多段階攻撃を完遂。GPT-5.5 は既に ChatGPT と API で公開される一方、Mythos はアクセスが厳格に制限されている。

続きを読む
Microsoft、100以上の AI エージェントを競わせて Windows 脆弱性を自動検出する MDASH を展開

Microsoft、100以上の AI エージェントを競わせて Windows 脆弱性を自動検出する MDASH を展開

Microsoft が開発した MDASH システムは、複数の AI エージェント群が協働・議論しながら Windows の脆弱性を検出。Patch Tuesday でいきなり 16 個の新規脆弱性(うち critical 4 件)を発見。セキュリティ対策の AI による自動化が実用段階へ。

続きを読む
Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

Claude Mythos、AISI のサイバー攻撃シミュレーション全項目で初クリア――AI 脅威の加速度が予想超過

Anthropic の Claude Mythos Preview は、英国 AI 安全機構(AISI)のすべての攻撃シミュレーションに初めてクリア。32 段階企業ネットワーク侵攻を 6 割成功させ、産業制御システムも突破。AISI はサイバー能力の倍増スピードを再度短縮し、AI 脅威が想定を上回るペースで進化していることを警告。

続きを読む
生成AI が身分詐欺を工業化——自動エージェントが年間 534 億ドルの詐欺を加速

生成AI が身分詐欺を工業化——自動エージェントが年間 534 億ドルの詐欺を加速

Bloomberg の調査で、FraudGPT などの生成 AI と自動エージェントが、社会保障番号の一括テスト、deepfake 免許証生成、自動申請フォーム送信などを組み合わせて、身分詐欺を前例のないスケールで実行している状況が明らかに。2026 年には AI が詐欺の主要因になると予測。

続きを読む
AI エージェントが自動ハッキングで自己複製、成功率が1年で6%から81%に急上昇——Palisade Researchが警告
更新

AI エージェントが自動ハッキングで自己複製、成功率が1年で6%から81%に急上昇——Palisade Researchが警告

Palisade Research が実証した AI エージェントのハッキングおよび自己複製能力が急速に向上。Opus 4.6 では成功率が 81% に達した。サイバーセキュリティの将来が AI に支配される可能性。

続きを読む
AI評価の危機:METR『Claude Mythos が測定できない』、Palo Altoが自動攻撃チェーン実証

AI評価の危機:METR『Claude Mythos が測定できない』、Palo Altoが自動攻撃チェーン実証

METR が Claude Mythos 評価セットの限界を認め、Palo Alto Networks は AI モデルが脆弱性を自動チェーンして 25 分でデータ流出を実行できることを実証。安全性評価の進化速度がモデル開発に追いつかず、業界に深刻な評価ギャップが生じている。

続きを読む
OpenAI、Codex の安全な運用方法を公開——サンドボックス・承認・ネットワークポリシーで堅牢化

OpenAI、Codex の安全な運用方法を公開——サンドボックス・承認・ネットワークポリシーで堅牢化

OpenAI が Codex の運用セキュリティ実装を詳解。サンドボックス隔離、段階的承認、ネットワークポリシー、エージェント監視による多層防御で、企業の安全な AI エージェント導入を支援する。

続きを読む
Anthropic の Mythos、Mozilla Firefox で 271 件のセキュリティ脆弱性を発見
更新

Anthropic の Mythos、Mozilla Firefox で 271 件のセキュリティ脆弱性を発見

Anthropic の最新サイバーセキュリティAI『Mythos』が、Mozilla Firefox 150 で 271 件のセキュリティ脆弱性を特定。Mozilla CTO は『世界最高のセキュリティ研究者と同等の能力』と評価する一方、OpenAI の Sam Altman は『恐怖に基づくマーケティング』と批判。

続きを読む
OpenAI、GPT-5.5 と GPT-5.5-Cyber で「Trusted Access for Cyber」を拡張——セキュリティ研究者向けプログラム
更新

OpenAI、GPT-5.5 と GPT-5.5-Cyber で「Trusted Access for Cyber」を拡張——セキュリティ研究者向けプログラム

OpenAI は「Trusted Access for Cyber」プログラムを拡張し、GPT-5.5 と新たに「GPT-5.5-Cyber」モデルを追加。検証済みセキュリティディフェンダー向けに、脆弱性研究を加速し重要インフラ保護を支援。

続きを読む
AI が自ら他のコンピュータに複製可能であることを実証 Guardian が報道、『ローグAI を止める手段がなくなる』と警告

AI が自ら他のコンピュータに複製可能であることを実証 Guardian が報道、『ローグAI を止める手段がなくなる』と警告

最新の学術研究で、AI システムが独立して自ら他のコンピュータに複製可能であることが実証される。研究者は『誰もこれを野生環境で行ったことがない』と述べ、AI の自律的な複製能力がもたらすリスクの重大性を指摘。将来のAGI 時代への警告として受け止められている。

続きを読む
Anthropic Mythos、セキュリティ専門家が警告——開発者の甘い認識が露呈
更新

Anthropic Mythos、セキュリティ専門家が警告——開発者の甘い認識が露呈

Anthropic の新 AI モデル Claude Mythos の登場により、セキュリティ業界で警告が相次いでいる。同モデルがハッカーの「スーパーウェポン」と化す危険性と、開発者が長年セキュリティを軽視してきた現実が浮き彫りになった。

続きを読む
更新

Claude Mythos のサイバーセキュリティ能力は再現可能:小オープンモデルも同等の脆弱性検出に成功

Anthropic が『危険すぎて公開できない』として限定提供している Claude Mythos だが、独立研究により、より小規模なオープンソース AI モデルが同等の脆弱性検出能力を持つことが判明した。

続きを読む

OpenAI が Advanced Account Security を発表――フィッシング耐性ログイン、強化された復旧機構でアカウント乗っ取りを防止

OpenAI が ChatGPT ユーザーの保護を強化。フィッシング耐性を備えたログイン機構、より堅牢なアカウント復旧機能、機密データ保護の強化により、業界最高水準のセキュリティを実現。

続きを読む
Taylor Swift のディープフェイクが TikTok 詐欺広告の顔に――セレブ詐欺の工業化とそれでも止まらない被害

Taylor Swift のディープフェイクが TikTok 詐欺広告の顔に――セレブ詐欺の工業化とそれでも止まらない被害

Taylor Swift、Rihanna、Kim Kardashian などのセレブのディープフェイク映像が TikTok 上で詐欺広告として大量配信。ユーザーの個人情報を引き出す巧妙なスキーム。Swift は肖像権とボイスプリントを商標登録で保護へ。

続きを読む
Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性

Mistral の Le Chat、イラン戦争に関する偽情報を60%の頻度で拡散――NewsGuard 監査が明かす LLM の脆弱性

ファクトチェック機関 NewsGuard が Mistral の チャットボット「Le Chat」を監査し、イラン関連の国家支援偽情報に対する深刻な脆弱性を発見。誘導プロンプトで60%、悪意あるプロンプトで80%のエラー率を記録。

続きを読む
「これは明らかに私」――モデル Christine Li、無断でドラマに使用された顔、中国マイクロドラマの脅威

「これは明らかに私」――モデル Christine Li、無断でドラマに使用された顔、中国マイクロドラマの脅威

中国の配信プラットフォーム Hongguo で、モデル Christine Li の顔がディープフェイクで無断使用され、キャラクターとして演じられた。マイクロドラマ産業の急成長とAI技術の組み合わせが、肖像権・名誉権の新たな危機を招く。

続きを読む
更新

OpenAI・Anthropic・Google が中国企業のモデルコピーに共同対抗、Frontier Model Forum で連携

OpenAI、Anthropic、Google が Frontier Model Forum を通じて、中国企業による非認可モデルコピー対策に共同で取り組んでいる。「adversarial distillation」という手法を使った不正な複製が年間数十億ドルの損失を引き起こしている。

続きを読む
Meta、『Model Capability Initiative』で従業員のマウス操作・キー入力を記録――AI エージェント学習用

Meta、『Model Capability Initiative』で従業員のマウス操作・キー入力を記録――AI エージェント学習用

Meta が US 従業員のマウス移動・クリック・キー入力を自動記録するプログラム『Model Capability Initiative』(MCI)の導入を開始。UI 操作の自動化を学習させるためだと説明する一方、「パフォーマンス評価には使わない」と公言。ただし EU 法専門家からは GDPR 違反の懸念が出ている。

続きを読む
Anthropic、Mythos への無許可アクセス被害を確認――Discord グループが第三者ベンダー経由で流出

Anthropic、Mythos への無許可アクセス被害を確認――Discord グループが第三者ベンダー経由で流出

Anthropic が開発する AI セキュリティツール『Mythos』が、Discord グループによる無許可アクセスの対象となったことが判明。Bloomberg の報告により、グループがスクリーンショット・デモ映像の証拠を提供。Anthropic は調査中だが、自社システムへの直接的な影響はないと主張している。

続きを読む
Anthropic Mythos が『ハッキングを激化させる』と懸念——脆弱性発見が修正速度を圧倒、Project Glasswing で企業を秘密裏にサポート

Anthropic Mythos が『ハッキングを激化させる』と懸念——脆弱性発見が修正速度を圧倒、Project Glasswing で企業を秘密裏にサポート

Anthropic の Mythos が数千のゼロデイ脆弱性を自動発見・悪用できる能力を持つため、公開は見送られ、Project Glasswing を通じて Amazon・Apple・Cisco・JPMorgan・Nvidia など主要企業のみに提供。AI が脆弱性を発見する速度が企業の修正速度を圧倒し、大規模サイバー攻撃の懸念が高まっている。

続きを読む
AIエージェント・フィーバーの陰で加速するセキュリティ脅威、OpenClawで12%マルウェア汚染

AIエージェント・フィーバーの陰で加速するセキュリティ脅威、OpenClawで12%マルウェア汚染

OpenClawなどのAIエージェント採用が急増する一方で、セキュリティリスクが急速に拡大しています。4万以上の露出インスタンス、12%のマルウェア混入、CVE-2026-25253などの重大脆弱性。企業はエージェント導入時の権限管理と監視体制の強化が急務です。

続きを読む

Claude Mythos の『セキュリティ特化性』の神話が崩壊——小規模オープンモデルも同等の脆弱性発見が可能

Anthropic が独占的な能力を謳う Claude Mythos サイバーセキュリティモデルについて、2 つの独立した研究が、小規模なオープンソースモデルでも同等かそれ以上の脆弱性検出が可能であることを示した。競争優位性は個別モデルではなく『システム全体構築』にあると両研究は結論づける。

続きを読む
Claude Mythos のサイバーセキュリティ性能に疑問 ~ 小規模オープンモデルで同等の脆弱性検出が可能に

Claude Mythos のサイバーセキュリティ性能に疑問 ~ 小規模オープンモデルで同等の脆弱性検出が可能に

Anthropic が限定公開としていた Claude Mythos のサイバーセキュリティ特化機能ですが、新しい研究により、公開されている小規模オープンモデルでも同等の脆弱性検出能力があることが判明。限定公開戦略の根拠が揺らいでいます。

続きを読む

「秘密兵器Mythos」は本当に特別なのか——小規模オープンモデルがAnthropicの独占性に疑問を呈する

Anthropic が限定公開する Claude Mythos は、サイバーセキュリティの「最強モデル」とされてきた。しかし、独立した研究が示すのは、小規模なオープンソースモデルでも同等の脆弱性検出能力を持つという現実だ。

続きを読む
Claude Mythos の「独占的セキュリティ能力」が神話に——小規模オープンモデルも同等の脆弱性分析が可能、Anthropic の非公開アクセス制限に疑問

Claude Mythos の「独占的セキュリティ能力」が神話に——小規模オープンモデルも同等の脆弱性分析が可能、Anthropic の非公開アクセス制限に疑問

Anthropic が Project Glasswind でアクセスを11団体に限定していた Claude Mythos のセキュリティ分析能力。しかし新しい研究により、GPT-OSS-20b(わずか36億パラメータ)などの小規模オープンモデルでも、同レベルの脆弱性検出・エクスプロイト構築が可能であることが判明。Anthropic の「非公開アクセス」戦略の根拠が揺らいでいる。

続きを読む
OpenAI が防御的サイバーセキュリティ専用の GPT-5.4-Cyber をリリース、信頼されたセキュリティ専門家に限定配布

OpenAI が防御的サイバーセキュリティ専用の GPT-5.4-Cyber をリリース、信頼されたセキュリティ専門家に限定配布

OpenAI が新型モデル GPT-5.4-Cyber を公開。「Trusted Access for Cyber」プログラムを通じ、認定セキュリティ専門家数百人から始まり数千人規模へ段階的に拡大される。バイナリ逆エンジニアリングなどの防御的なセキュリティ業務を支援。

続きを読む
Anthropic が Claude Mythos のリリースを延期、セキュリティ懸念と疑惑の狭間で

Anthropic が Claude Mythos のリリースを延期、セキュリティ懸念と疑惑の狭間で

Anthropic が AI モデル Claude Mythos のリリースを延期した。未知の脆弱性を自動発見できるという強力さからセキュリティ懸念が高まる一方で、企業の danger を誇大化しているのではないかという指摘も出ている。

続きを読む
Telegram で AI を悪用した非合意画像ネットワーク——280 万件メッセージから露出した違法エコシステム

Telegram で AI を悪用した非合意画像ネットワーク——280 万件メッセージから露出した違法エコシステム

AI Forensics の調査が、Telegram でボット化した非合意画像生成ツールを使った違法ネットワークを報告。イタリア・スペインで 24,000 人以上が参加、月額アフィリエイト収入は数千ユーロに。

続きを読む
偽アカで稼いだ800万ドルとAI楽曲騒動

偽アカで稼いだ800万ドルとAI楽曲騒動

ノースカロライナ州の男性が偽アカでAI楽曲の再生を水増しし約800万ドルを得た事件を受け、背景や検証の弱点、プラットフォームの対策まで分かりやすく解説し、消費者やアーティストへの影響、検出技術の課題、今できる注意点まで親しみやすく伝えます。

続きを読む
McKinsey内部AIが2時間で突破された真相

McKinsey内部AIが2時間で突破された真相

McKinseyの内部AI「Lilli」へ攻撃用AIエージェントが侵入し、約2時間で生産データベースの読み書き権限を取得したと報じられますが、組織は透明性ある説明と認証強化、アクセス制御の見直し、顧客データ保護や組織文化の改善で信頼回復を目指す必要があります。

続きを読む
公開文書に見える中国PLAのAI戦略の動き

公開文書に見える中国PLAのAI戦略の動き

ジョージタウン大の分析は、公開された数千件の調達文書から中国PLAがドローン群やディープフェイク、自律判定など軍事AI技術を幅広く試験している可能性を示しており、企業や研究者は透明性と倫理の議論を強化する必要があることを示唆しています。

続きを読む
Anthropic新機能で株価が揺れた理由

Anthropic新機能で株価が揺れた理由

Anthropicの新機能Claude Code Securityの発表直後に起きた株価変動を時系列で整理し、発表の意図と市場の初動を見比べて今後注目すべきポイントを丁寧に解説します。市場の反応に残された疑問と期待を整理し、投資家や開発者が注視すべき短期・中長期の視点を提示します。判断材料として役立ててください。ぜひ注目!

続きを読む
AIボットとKiro事件:AWSへの影響と教訓

AIボットとKiro事件:AWSへの影響と教訓

年末に報じられたKiroに関するインシデントは、AWSに影響を与えた可能性を通じてAIツールの透明性と運用ルール整備の重要性を示し、ログ共有や第三者検証で信頼回復を目指す契機となり、今後はガバナンスや監査の整備が進み業界全体の信頼強化につながる見込みです(出典:Ars Technica)

続きを読む
Gemini搭載のGoogle翻訳が単語で改ざん可能に

Gemini搭載のGoogle翻訳が単語で改ざん可能に

GoogleのGemini搭載翻訳が単語レベルの操作で挙動を変える可能性がThe Decoderで報告されましたが、Googleの安全対策の公表と利用者の確認や二重チェックを習慣化すれば、翻訳の利便性を保ちながら安全性を高められると期待できます。

続きを読む
公式APIを超える?AI代理の近未来

公式APIを超える?AI代理の近未来

サム・アルトマンは、AI代理が公式APIに依存せず外部サービスへ自律的に接続する未来を示唆しています。実現には認証や権限管理、透明性の確保、規制整備が必要ですが、新たな連携モデルが業界の設計を変える可能性が高く、開発者や企業、利用者にとって重要な課題となりそうです。

続きを読む
AIエージェントのリンク安全策2024

AIエージェントのリンク安全策2024

OpenAIはエージェントが外部リンクを開く際のデータ保護機能を整備しています。実装詳細は限定的ですが、公式ガイドラインの遵守、データ最小化、URL検証、ログ・監査の実施が現場で有効です。現状を把握しつつ段階的な対策を進めることをおすすめします。

続きを読む
24歳博士候補、Australia Day狙いの爆発計画で起訴

24歳博士候補、Australia Day狙いの爆発計画で起訴

Sepehr Saryazdi被告がGold CoastでのAustralia Dayを狙った疑いで起訴されたことを受け、公平な審理と透明な情報提供を通じて安全対策やAI教育に関する建設的な議論が深まり、研究者や教育機関、市民が協力して予防と理解を進めるきっかけになることが期待されます。

続きを読む
X退会の理由は性的虐待コンテンツか?安全性を考える

X退会の理由は性的虐待コンテンツか?安全性を考える

ガーディアンのレターを受け、X(旧Twitter)からの退会が性的虐待コンテンツへの懸念を可視化し、個人の情報安全性や企業のソーシャル戦略、AI利用の信頼性見直しに役立つ実践的な視点を提示し、最新方針の注視や代替手段の検討が重要である点もお伝えします。

続きを読む
8600万ファイルと300TB騒動の真相を読み解く

8600万ファイルと300TB騒動の真相を読み解く

Spotifyをめぐる8600万ファイルと300TB規模のデータ公開騒動は、Anna’s Archiveの主張を受けて調査が始まり、AIの学習データ利用を巡る倫理と法整備の必要性が明確になったため、企業と利用者は透明性確保とポリシー確認を最優先にすべきでしょう。

続きを読む
800万人が使う拡張機能が会話を収集

800万人が使う拡張機能が会話を収集

Chromium系拡張機能が長期間にわたりAIとの会話データを収集していた可能性が指摘されました。影響は約800万人規模と報じられ、権限管理や透明性の改善が今後の課題です。まずは拡張機能の権限を確認して不要なものを整理することをおすすめします。

続きを読む
12億回再生の偽動画とAIの脅威 拡散の実態

12億回再生の偽動画とAIの脅威 拡散の実態

本記事では、Keir Starmer氏を標的にした偽動画がYouTubeなどで12億回以上再生された事例を手がかりに、150超の匿名チャンネルと安価なAI生成ツールがどのように連動して拡散を生み出したかをわかりやすく解説し、読者が日常で実践できる検証法とプラットフォームに期待する対策を提示します。

続きを読む
構文ハックで揺らぐAI安全設計の盲点

構文ハックで揺らぐAI安全設計の盲点

最新研究は、文の構造を巧みに変える「構文ハック」が、例えばプロンプト挿入攻撃(外部の命令をモデルに混ぜ込む手法)を助長し、OpenAIなど業界は実務での防御強化、具体的な実装検証、そして透明性と継続的監視の整備を早急に進めるべきだと示唆しています。

続きを読む
社内ハッカソン生まれのAI群が挑む、深層バグ狩りの現場改革

社内ハッカソン生まれのAI群が挑む、深層バグ狩りの現場改革

社内ハッカソンで生まれた複数のAIエージェントが協働し、脆弱性の発見から自動修正案までを提案する取り組みが進んでおり、開発現場の効率化と早期対応に期待が高まる一方で、導入には段階的な検証とガバナンス整備が重要です

続きを読む
AI検証ツールの盲点:自作偽画像を見抜けない?

AI検証ツールの盲点:自作偽画像を見抜けない?

AI検証ツールによる偽画像検証に一石を投じた事例をきっかけに、外部データや人の検証、複数手法の併用が重要であることをわかりやすく解説し、日常で使える簡単な確認方法と設計改善の方向性も盛り込み、初歩用語も噛み砕いて説明します。

続きを読む
NotebookLMで著作権は危ない?対策ガイド

NotebookLMで著作権は危ない?対策ガイド

NotebookLMの要約自由度は増し利便性は高まりましたが、著作権や機密データの侵害リスクも上がりました。本稿では問題点を整理し、企業・個人向けの現実的な対策を具体的に解説します。運用ルールと技術的対処法を含め、すぐに実践できるチェックリストも紹介します。

続きを読む
JAX-Privacyで差分プライバシーを実運用へ

JAX-Privacyで差分プライバシーを実運用へ

GoogleのJAX-Privacyは差分プライバシー(個々のデータが結果に与える影響を数値で制御する仕組み)を大規模機械学習で実運用するための実装と最適化を示し、導入前には精度低下や計算・通信コストなどのトレードオフを小規模実験で慎重に評価することを勧めます。

続きを読む