Cảnh báo rò rỉ dữ liệu của DeepSeek đã bị bác bỏ; token đặc biệt kích hoạt bộ nhớ mô hình, không phải vi phạm đa thuê bao (multi-tenant)

DEEPSEEK-5,01%

Theo giám sát của Beating, một tuyên bố lan truyền gần đây cho rằng việc nhập các token đặc biệt như <|begin_of_sentence|> vào ô chat của DeepSeek có thể làm lộ các cuộc trò chuyện của người dùng khác, được gắn nhãn là lỗi cô lập đa người thuê (multi-tenant) mức P0. Trên thực tế, hiện tượng này không liên quan đến cô lập dữ liệu. Khi được kích hoạt bằng các token như vậy, mô hình sẽ chuyển sang các mẫu định dạng trong thời gian huấn luyện và tạo ra đoạn hội thoại bịa đặt dựa trên trí nhớ và các prompt hệ thống của chính nó—không phải là truy xuất theo thời gian thực từ các phiên khác. Đây là Trích xuất dữ liệu huấn luyện (Training Data Extraction), một lỗ hổng dùng chung trên tất cả các mô hình ngôn ngữ lớn, không riêng gì DeepSeek. Google DeepMind đã công bố nghiên cứu vào năm 2023 cho thấy các đầu vào đặc biệt có thể trích xuất dữ liệu huấn luyện từ GPT và PaLM. Bài viết Magpie tại ICLR 2025 khai thác trực tiếp cơ chế này. Các tuyên bố rằng nội dung bị rò rỉ có bao gồm ngày hôm nay không chứng minh được lỗi cô lập đa người thuê, vì DeepSeek đưa ngày hiện tại vào prompt hệ thống của mình, và các mô hình tự nhiên sẽ tích hợp nó vào đầu ra được tạo.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận