Luo Fuli đã đóng vai trò then chốt trong việc phát triển DeepSeek-V2 và các mô hình ngôn ngữ lớn có thể cạnh tranh với ChatGPT nhưng chỉ cần chi phí thấp hơn nhiều.
Luo Fuli trở thành cái tên nổi tiếng trong giới nghiên cứu AI nhờ năng khiếu xử lý ngôn ngữ tự nhiên. Cô theo học ngôi trường danh tiếng Đại học Sư phạm Bắc Kinh. Sau đó, Luo Fuli được nhận vào Viện Ngôn ngữ học tính toán thuộc Đại học Bắc Kinh.
Cô còn là tác giả của 8 bài nghiên cứu tại hội nghị của Hiệp hội Ngôn ngữ học tính toán (ACL) vào năm 2019. Công trình nghiên cứu của Luo Fuli khiến các ông lớn công nghệ Trung Quốc như Alibaba và Xiaomi để mắt.
Sau thành công tại ACL, Luo gia nhập Học viện DAMO của Alibaba, đơn vị nghiên cứu hàng đầu chuyên tập trung vào AI và học máy. Tại Học viện DAMO, cô là người dẫn đầu trong phát triển VECO, một mô hình AI được đào tạo trước đa ngôn ngữ. VECO được thiết kế để cải thiện khả năng dịch máy và hiểu ngôn ngữ tự nhiên. Luo cũng góp sức trong dự án mã nguồn mở AliceMind của Alibaba. Những thành tích này càng nâng cao danh tiếng của Luo là nhà nghiên cứu hàng đầu trong lĩnh vực AI.
Năm 2022, cô gia nhập DeepSeek và đóng góp vào việc xây dựng các mô hình ngôn ngữ lớn. Ở thời điểm đó, DeepSeek được biết đến với cái tên quỹ đầu cơ định lượng High-Flyer, sử dụng các thuật toán toán học phức tạp để giao dịch.
Đến năm 2023, ông Liang Wenfeng (40 tuổi) thành lập DeepSeek tại thành phố Hàng Châu. Trong thời gian làm việc tại DeepSeek và đặc biệt là tạo ra DeepSeek V2, tài năng của Luo Fuli được công nhận nhiều hơn.
Tờ Bưu điện Hoa Nam Buổi sáng (Hong Kong, Trung Quốc) đưa tin, Luo Fuli đã "lọt vào mắt xanh" của nhà sáng lập Xiaomi Lei Jun. Ông đã chiêu mộ và sẵn sàng chi mức lương khủng 10 triệu nhân dân tệ/năm để Luo Fuli đầu quân cho tập đoàn này.
Vào năm 2024, Luo Fuli xuất bản nghiên cứu cùng với một số người khác, cho phép truy cập vào mã nguồn mở DeepSeek để hỗ trợ mở rộng ranh giới nghiên cứu.
Vào tháng 1/2025, DeepSeek phát hành mô hình mới nhất DeepSeek-R1. Mô hình này đã nhanh chóng thu hút được sự chú ý đáng kể nhờ khả năng lập luận tiên tiến, được cho là đã đạt được khả năng tương đương với các hệ thống AI hàng đầu, như ChatGPT của OpenAI, nhưng với chi phí phát triển chỉ bằng một phần nhỏ. Trong khi OpenAI phải mất hàng tỷ USD để phát triển thì DeepSeek chỉ tốn 5,6 triệu USD. Việc ra mắt DeepSeek-R1 đã gây chấn động ngành công nghệ, khiến giá cổ phiếu của các công ty công nghệ lớn, trong đó có Microsoft, Meta và Nvidia, giảm đáng kể vào ngày 27/1.
Không chỉ Luo Fuli mà nhóm đứng sau DeepSeek cũng được xây dựng theo cách tiếp cận độc đáo của người sáng lập Liang Wenfeng. Bản thân ông Wenfeng đã học ngành AI tại Đại học Chiết Giang. Tên của Liang cũng có trong báo cáo kỹ thuật.
Nhóm tạo ra Deepseek bao gồm những người mới vào nghề, tốt nghiệp đại học và cả những cá nhân có ít kinh nghiệm làm việc, bao gồm 150 nhà nghiên cứu và kỹ sư người Trung Quốc, ngoài ra còn có một nhóm 31 nhà nghiên cứu tự động hóa dữ liệu.
Theo Bưu điện Hoa Nam Buổi sáng, một số thành viên chủ chốt của nhóm là ông Guo Daya, tiến sĩ Đại học Quốc lập Trung Sơn; Zhu Qihao và Dai Damai đều tốt nghiệp Tiến sĩ tại Đại học Bắc Kinh; sinh viên vật lý tại Đại học Bắc Kinh Gao Huazuo; và sinh viên ngành AI tại Đại học Bưu chính Viễn thông Bắc Kinh - Zeng Wangding.