การวิจัยพบว่า AI chatbots ส่วนใหญ่ถูกหลอกได้ง่ายในการให้คำตอบที่เป็นอันตราย


นักวิจัยกล่าวว่า The Hacker AI-powered chatbots ขู่ว่าจะได้รับความรู้ที่เป็นอันตรายโดยการส่งเสริมข้อมูลที่ผิดกฎหมายที่โปรแกรมดูดซับในระหว่างการฝึกอบรมนักวิจัยกล่าว

ในเทรนด์ที่น่ารำคาญของ chatbots คำเตือนคือ “Jailbreak” เพื่อข้ามการควบคุมความปลอดภัยในตัว ข้อ จำกัด เหล่านี้ควรป้องกันไม่ให้โปรแกรมให้คำตอบที่เป็นอันตรายลำเอียงลำเอียงหรือไม่เหมาะสมสำหรับคำถามของผู้ใช้

เครื่องยนต์ของ chatbots เช่น Chatgpt, Gemini และ Claude (LLMs) เช่น Chatgpt, Gemini และ Claude สามารถป้อนเนื้อหาจำนวนมากจากอินเทอร์เน็ต

แม้จะมีความพยายามในการตัดข้อความที่เป็นอันตรายจากข้อมูลการฝึกอบรม LLMs ยังสามารถดูดซับข้อมูลเกี่ยวกับกิจกรรมที่ผิดกฎหมายเช่นการแฮ็คการฟอกเงินการซื้อขายหลักทรัพย์ภายในและการผลิตระเบิด การควบคุมความปลอดภัยได้รับการออกแบบมาเพื่อป้องกันไม่ให้พวกเขาใช้ข้อมูลนี้ในการตอบกลับ

นักวิจัยสรุปในรายงานเกี่ยวกับภัยคุกคามว่ามันง่ายที่จะหลอกแชทบอท AI ที่ขับเคลื่อนโดยส่วนใหญ่ในการผลิตข้อมูลที่เป็นอันตรายและผิดกฎหมายแนะนำว่าความเสี่ยงคือ“ ทันทีจับต้องได้ลึก”

“ สิ่งที่ครั้งหนึ่งเคยถูก จำกัด ให้กับนักแสดงของรัฐหรือกลุ่มอาชญากรรมที่จัดขึ้นในไม่ช้าอาจอยู่ในมือของใครก็ตามในโทรศัพท์หรือแม้แต่บนโทรศัพท์ของพวกเขา” ผู้เขียนเตือน

การศึกษานำโดยศาสตราจารย์ Lior Rokach และ Dr. Michael Fire จาก Ben Gurion University, Nelev University, Israel ระบุถึงภัยคุกคามที่เพิ่มขึ้นของ“ Dark LLMS” ซึ่งเป็นรูปแบบ AI ที่ได้รับการออกแบบอย่างจงใจโดยไม่มีการควบคุมความปลอดภัยหรือแก้ไขโดย Jailbreak บางคนส่งเสริมการประชาสัมพันธ์ออนไลน์“ ไม่มีรั้วทางศีลธรรม” และยินดีที่จะช่วยเหลือในกิจกรรมที่ผิดกฎหมายเช่นอาชญากรรมไซเบอร์และการฉ้อโกง

Jailbreak มีแนวโน้มที่จะใช้เคล็ดลับที่สร้างขึ้นมาอย่างดีเพื่อหลอกแชทบอทให้เกิดการตอบสนองที่ต้องห้ามตามปกติ พวกเขาทำตามคำแนะนำของผู้ใช้โดยใช้ประโยชน์จากความตึงเครียดระหว่างเป้าหมายหลักของโปรแกรมและหลีกเลี่ยงคำตอบที่เป็นอันตรายลำเอียงลำเอียงผิดศีลธรรมหรือผิดกฎหมาย เคล็ดลับมีแนวโน้มที่จะสร้างแผนที่แผนจัดลำดับความสำคัญของข้อ จำกัด ด้านความปลอดภัย

เพื่อพิสูจน์ปัญหานี้นักวิจัยได้พัฒนาการแหกคุกสากลที่บุกรุกแชทบอทชั้นนำหลายครั้งทำให้พวกเขาสามารถตอบคำถามที่พวกเขาปฏิเสธได้ตามปกติ รายงานระบุว่าครั้งหนึ่งเคยถูกบุกรุก LLM จะสร้างการตอบสนองต่อการสืบค้นเกือบทั้งหมด

“ มันน่าตกใจที่ได้เห็นองค์ประกอบของระบบความรู้นี้” ไฟกล่าว ตัวอย่างรวมถึงวิธีการถอดรหัสเครือข่ายคอมพิวเตอร์หรือทำยารวมถึงคำแนะนำทีละขั้นตอนสำหรับกิจกรรมทางอาญาอื่น ๆ

“ สิ่งที่ทำให้ภัยคุกคามนี้แตกต่างจากความเสี่ยงทางเทคนิคก่อนหน้านี้คือการผสมผสานระหว่างการเข้าถึงความสามารถในการปรับขนาดและการปรับตัวได้อย่างไม่เคยปรากฏมาก่อน” Rokach กล่าวเสริม

นักวิจัยได้ติดต่อผู้ให้บริการหลักของ LLM เพื่อเตือนพวกเขาถึงการแหกคุกสากล แต่กล่าวว่าการตอบสนองคือ “ไม่หยุดยั้ง” บริษัท หลายแห่งล้มเหลวในการตอบสนองในขณะที่คนอื่น ๆ กล่าวว่าการโจมตีของการแหกคุกอยู่นอกขอบเขตของโปรแกรมเงินรางวัลที่ให้รางวัลแฮ็กเกอร์จริยธรรมที่ปฏิบัติตามช่องโหว่ของซอฟต์แวร์

รายงานกล่าวว่า บริษัท เทคโนโลยีควรผ่านการฝึกอบรมอย่างระมัดระวังมากขึ้นเพิ่มไฟร์วอลล์ที่ทรงพลังเพื่อบล็อกการสืบค้นและการตอบสนองความเสี่ยงและพัฒนาเทคโนโลยี “เครื่องไม่เรียนรู้” เพื่อให้แชทบอทสามารถ “ลืม” ข้อมูลที่ผิดกฎหมายใด ๆ ที่พวกเขาดูดซับ มันเสริมว่า LLM ที่มืดควรถูกมองว่าเป็น “ความเสี่ยงด้านความปลอดภัยที่ร้ายแรง” ซึ่งเป็นคู่แข่งกับอาวุธและวัตถุระเบิดในขณะที่ผู้ให้บริการรับผิดชอบ

ดร. Ihsen Alouani ผู้ทำงานด้านความปลอดภัยของ AI ที่ Belfast ของ Queen กล่าวว่าการโจมตีของ Jailbreak ใน LLMs อาจก่อให้เกิดความเสี่ยงที่แท้จริงจากการให้คำแนะนำโดยละเอียดเกี่ยวกับการผลิตอาวุธเพื่อโน้มน้าวข้อมูลเท็จหรือวิศวกรรมสังคมและการหลอกลวงอัตโนมัติ“ ด้วยความซับซ้อนที่น่าทึ่ง”

“ ส่วนสำคัญของการแก้ปัญหาคือการให้ บริษัท ลงทุนอย่างจริงจังมากขึ้นในทีมสีแดงและเทคโนโลยีที่แข็งแกร่งระดับโมเดลแทนที่จะพึ่งพาการป้องกันส่วนหน้าเท่านั้น” เขากล่าว “ เราต้องการมาตรฐานที่ชัดเจนและการกำกับดูแลอิสระเพื่อให้ทันกับสภาพแวดล้อมการคุกคามที่พัฒนาขึ้น”

ศาสตราจารย์ Peter Garraghan ผู้เชี่ยวชาญด้านความปลอดภัยของ AI ที่ Lancaster University กล่าวว่า“ องค์กรต้องปฏิบัติต่อ LLM เช่นเดียวกับองค์ประกอบซอฟต์แวร์ที่สำคัญอื่น ๆ ซึ่งต้องมีการทดสอบความปลอดภัยอย่างเข้มงวดกลุ่มสีแดงอย่างต่อเนื่องและการสร้างแบบจำลองการคุกคามบริบท

เขากล่าวเสริมว่า: “ใช่การเจลเบรคเป็นปัญหา แต่ความรับผิดชอบจะยังคงเป็นเพียงผิวเผินโดยไม่เข้าใจสแต็ก AI เต็มรูปแบบข้อกำหนดด้านความปลอดภัยที่แท้จริงไม่เพียง แต่การเปิดเผยที่รับผิดชอบ แต่การออกแบบที่รับผิดชอบและการปฏิบัติงานการปรับใช้”

Openai บริษัท ที่จัดตั้ง CHATGPT กล่าวว่ารูปแบบ O1 ล่าสุดอาจให้เหตุผลเกี่ยวกับนโยบายความปลอดภัยของ บริษัท ซึ่งจะเป็นการเพิ่มความยืดหยุ่นในการแหกคุก บริษัท เสริมว่าได้ทำการตรวจสอบวิธีที่จะทำให้โปรแกรมมีประสิทธิภาพยิ่งขึ้น

Meta, Google, Microsoft และมานุษยวิทยาได้รับการติดต่อเพื่อแสดงความคิดเห็น Microsoft ตอบสนองต่อลิงค์ไปยังบล็อกเพื่อรักษางานเพื่อป้องกันการถูกคุกคาม



Source link

  • Related Posts

    แคนาดาเรียกเอกอัครราชทูตอิสราเอลหลังจากนักการทูตยิงบนเวสต์แบงก์ – แห่งชาติ | GlobalNews.ca

    รัฐมนตรีต่างประเทศ Anita Anita กล่าวเมื่อวันพุธว่าแคนาดากำลังเรียกเอกอัครราชทูตอิสราเอลหลังจาก IDF ถูกยิงใกล้กับคณะผู้แทนทางการทูตเวสต์แบงก์ IDF กล่าวว่าไม่มีใครได้รับบาดเจ็บในเหตุการณ์ “เรารู้ว่าทีมของเราปลอดภัย” อานันท์กล่าวในบทความเกี่ยวกับ X “ฉันได้ขอให้เจ้าหน้าที่ของฉันเรียกเอกอัครราชทูตอิสราเอลเพื่อถ่ายทอดความกังวลอย่างจริงจังในแคนาดาเราหวังว่าจะมีการสอบสวนและความรับผิดชอบที่ครอบคลุม” โฆษกของ IDF กล่าวในแถลงการณ์ว่าทีมการทูตเยี่ยมชมเมือง Zhanning“ เบี่ยงเบน” เส้นทางที่ได้รับอนุมัติและทหารยิงปืนเตือนเพื่อให้พวกเขาอยู่ห่างจากพื้นที่ที่พวกเขาไม่ได้รับอนุญาตให้เยี่ยมชม IDF กล่าวว่าได้ตรวจสอบสิ่งที่เกิดขึ้นและจะพูดคุยกับนักการทูตที่ได้รับผลกระทบเพื่ออัปเดตสิ่งที่ค้นพบ เรื่องราวยังคงดำเนินต่อไปด้วยโฆษณาต่อไปนี้ Jean-Noël Barrot รัฐมนตรีว่าการกระทรวงการต่างประเทศของฝรั่งเศสกล่าวในโซเชียลมีเดียว่าสถานการณ์ไม่เป็นที่ยอมรับและเอกอัครราชทูตอิสราเอลประจำประเทศฝรั่งเศสได้ถูกเรียกให้อธิบาย รับข่าวระดับชาติ สำหรับข่าวที่ส่งผลกระทบต่อแคนาดาและทั่วโลกโปรดลงทะเบียนเพื่อแจ้งเตือนข่าวด่วนที่ส่งถึงคุณโดยตรงในเวลานั้น รัฐมนตรีต่างประเทศอิตาลีอันโตนิโอทาจานีกล่าวว่าเขายังเรียกร้องให้เอกอัครราชทูตอิสราเอลอธิบายเหตุการณ์ที่เกิดขึ้นในอิตาลี 2:02 เกี่ยวกับแรงกดดันระหว่างประเทศของอิสราเอลในสงครามฉนวนกาซา ในแถลงการณ์ร่วมที่ออกเมื่อต้นสัปดาห์ที่ผ่านมานายกรัฐมนตรีมาร์คคาร์นีย์นายกรัฐมนตรีอังกฤษ…

    CP Newsalert: Saskatchewan ถูกตัดสินจำคุก 17 ครั้งสำหรับการทารุณกรรมเด็ก

    มูสกราม – Sask Richard Dyke จะรับใช้มานานกว่า 14 ปีหลังจากพิจารณาเวลาที่เขาถูกควบคุมตัว 48 ปีสารภาพถึง 10 อาชญากรรม ในวันพุธที่ 5 กุมภาพันธ์ 2568 เอดมันตันเห็นอินทรีย์ RCMP Canadian Press/Jason Franson ราชวงศ์ยังคงมีค่าใช้จ่ายอื่น ๆ อีก 73 ข้อ แต่คำแถลงข้อเท็จจริงที่ตกลงกันกล่าวว่า Dyke ถูกทารุณกรรม 33…

    Leave a Reply

    Your email address will not be published. Required fields are marked *

    You Missed

    แคนาดาเรียกเอกอัครราชทูตอิสราเอลหลังจากนักการทูตยิงบนเวสต์แบงก์ – แห่งชาติ | GlobalNews.ca

    • By admin
    • May 21, 2025
    • 1 views
    แคนาดาเรียกเอกอัครราชทูตอิสราเอลหลังจากนักการทูตยิงบนเวสต์แบงก์ – แห่งชาติ | GlobalNews.ca

    CP Newsalert: Saskatchewan ถูกตัดสินจำคุก 17 ครั้งสำหรับการทารุณกรรมเด็ก

    • By admin
    • May 21, 2025
    • 1 views
    CP Newsalert: Saskatchewan ถูกตัดสินจำคุก 17 ครั้งสำหรับการทารุณกรรมเด็ก

    ชาวแคนาดาเป็นส่วนหนึ่งของทัวร์เวสต์โคสต์เมื่อ IDF เปิดภาพเตือนไฟไหม้: อานันท์ | ข่าว CBC

    • By admin
    • May 21, 2025
    • 2 views
    ชาวแคนาดาเป็นส่วนหนึ่งของทัวร์เวสต์โคสต์เมื่อ IDF เปิดภาพเตือนไฟไหม้: อานันท์ | ข่าว CBC

    Goldstein: ในแคนาดาการแพ้นำไปสู่ความเกลียดชัง

    • By admin
    • May 21, 2025
    • 1 views
    Goldstein: ในแคนาดาการแพ้นำไปสู่ความเกลียดชัง

    Premier Health รายงานผลการดำเนินงาน 2025 ไตรมาส 2 – นิตยสารธุรกิจแคนาดา

    • By admin
    • May 21, 2025
    • 1 views
    Premier Health รายงานผลการดำเนินงาน 2025 ไตรมาส 2 – นิตยสารธุรกิจแคนาดา

    Cematrix ประกาศรางวัลสัญญาใหม่ 5.7 ล้านเหรียญสหรัฐ – นิตยสารธุรกิจแคนาดา

    • By admin
    • May 21, 2025
    • 1 views
    Cematrix ประกาศรางวัลสัญญาใหม่ 5.7 ล้านเหรียญสหรัฐ – นิตยสารธุรกิจแคนาดา