Baidu và Alibaba khuyến khích đổi mới nhưng gặp bất lợi do thiếu dữ liệu phù hợp và sức mạnh tính toán
Baidu đang dẫn đầu mảng ChatGPT AI tại Trung Quốc với kế hoạch kết hợp chatbot Ernie vào công cụ tìm kiếm từ tháng tới © Qilai Shen/Bloomberg
Những gã khổng lồ công nghệ của Trung Quốc bao gồm Baidu, Alibaba và NetEase đang chạy đua để phù hợp với những phát triển gần đây của phương Tây về trí tuệ nhân tạo, mời chào các dự án mà họ hy vọng sẽ đạt được tiếng vang tương tự khi phát hành ChatGPT.
Sau nhiều tháng thông báo cắt giảm chi phí và giảm số lượng nhân viên, các nhóm lớn hiện đang lạc quan trình bày các kế hoạch đầu tư để cạnh tranh với chatbot của OpenAI, trong khi những kẻ lừa đảo thương hiệu đang xếp hàng để yêu cầu những từ liên quan đến thành tích của ChatGPT. Zhou Hongyi, người đứng đầu công ty bảo mật internet Qihoo 360, đã mô tả ChatGPT, một chương trình tạo ra các câu trả lời bằng văn bản thực tế cho các câu hỏi do con người đặt ra, là bước khởi đầu của cuộc cách mạng trí tuệ nhân tạo . “Nó có những thiếu sót nhưng cũng có tiềm năng không giới hạn,” anh ấy nói trong một cuộc thảo luận trên talk show tuần trước.
Cuộc đua để phù hợp với ChatGPT diễn ra khi các tập đoàn công nghệ Trung Quốc đã trải qua hơn hai năm quay cuồng với các cuộc tấn công theo quy định và đấu tranh để tăng trưởng trong bối cảnh suy thoái do Covid-19 gây ra.
Baidu đang thực hiện những bước đi ban đầu cụ thể nhất, với kế hoạch ra mắt một chatbot có tên Ernie trong công cụ tìm kiếm của mình trong vài tháng tới, tương tự như Bing Chat của Microsoft và OpenAI.
Mô hình AI làm cơ sở cho bot đã được phát triển từ năm 2019 với thế hệ mới nhất được đào tạo trên 260 tỷ thông số — có thể so sánh với GPT3, công nghệ nền tảng của ChatGPT, về kích thước, mặc dù được đào tạo trên một tập dữ liệu nhỏ hơn nhiều.
Baidu có kế hoạch tiết lộ chi tiết mới trong tuần này về cách chatbot sẽ được tích hợp vào các sản phẩm của mình, bao gồm tìm kiếm, xe điện và trợ lý thông minh, theo một người thân cận với công ty. “Baidu đã tập trung tài năng và tiền bạc vào việc này, vì vậy họ có nhiều khả năng xây dựng một trong những nền tảng GPT hàng đầu của Trung Quốc,” Boris Van, nhà phân tích tại Bernstein theo dõi các nỗ lực AI của Trung Quốc, cho biết. “Họ có rất nhiều điều thú vị khi ra mắt.”
Tin tức về triển khai tiềm năng của bot Ernie từ tháng 3 đã giúp cổ phiếu của Baidu tăng hơn 15%, trong khi Alibaba và NetEase được thúc đẩy nhờ những phát triển trong nghiên cứu AI tổng quát của họ.
Cổ phiếu của các nhóm AI nhỏ hơn như Hanwang Technology và CloudWalk Technology đã tăng gần gấp đôi trong năm nay. Phương tiện truyền thông nhà nước trong tháng này đã đưa ra một cảnh báo về sự điên cuồng đầu cơ.
Theo nhà cung cấp dữ liệu Tianyancha, kể từ tháng 12, hơn một chục công ty đã gấp rút đăng ký nhãn hiệu “ChatGPT” hoặc các từ khác có chứa “GPT” để sử dụng trong mọi thứ, từ dụng cụ khoa học đến bán quần áo và quảng cáo.
Chính quyền thành phố Bắc Kinh trong tháng này cho biết họ sẽ hỗ trợ các công ty xây dựng mô hình của riêng họ để phù hợp với ChatGPT, trong khi trường đại học hàng đầu của Thượng Hải Fudan đã tập hợp hơn một chục giám đốc điều hành công ty AI và các học giả để phân tích sự phát triển của ChatGPT, rủi ro bảo mật và các trường hợp sử dụng tiềm năng.
Tuy nhiên, các nhà phân tích và chuyên gia cho rằng sự phô trương và giá cổ phiếu tăng vọt xung quanh mỗi tuyên bố mới không phản ánh mức độ khó khăn của các nhóm Trung Quốc trong việc sao chép nhanh chóng phần mềm được xây dựng bởi OpenAI và Google.
“Mọi người đều muốn tạo ChatGPT ngay bây giờ, nhưng điều đó rất khó, đặc biệt là đối với các công ty Trung Quốc không thể có chip Nvidia mới nhất và có bộ dữ liệu hạn chế để đào tạo các mô hình AI,” Huan Li, người tạo ra WeChaty, một trong những chatbot phổ biến nhất của Trung Quốc, cho biết. các chương trình.
“Đào tạo một người mẫu tốn rất nhiều tiền, và nếu một bộ phận nào đó không phù hợp, nó sẽ không hoạt động,” anh nói.
Mặc dù Trung Quốc được biết đến với rất nhiều dữ liệu để đào tạo thuật toán, nhưng các nỗ lực chủ yếu tập trung vào các nhiệm vụ giám sát như nhận dạng và phát hiện đối tượng, hành động hoặc khuôn mặt, theo đánh giá về các bài báo AI của Trung Quốc trong Báo cáo tình trạng AI năm 2022 được xuất bản bởi các nhà đầu tư trong lĩnh vực.
Baidu đã phải vật lộn với nỗ lực trước đây của họ đối với một chatbot, được gọi là Plato, mà các nhà phân tích cho biết thậm chí không thể trả lời một câu hỏi đơn giản như: “Khi nào là sinh nhật của người đồng sáng lập Alibaba, Jack Ma?” Các nhà phân tích chỉ ra việc thiếu văn bản tiếng Trung chất lượng cao trên internet và trong các bộ dữ liệu khác là rào cản đối với việc đào tạo phần mềm AI.
GPT, chương trình nằm dưới ChatGPT, đã thu hút hàng trăm nghìn bài báo học thuật tiếng Anh, bài báo, sách và bài đăng trên mạng xã hội để tìm hiểu các mẫu hình thành nên ngôn ngữ. Trong khi đó, Ernie của Baidu được đào tạo chủ yếu dựa trên dữ liệu tiếng Trung cũng như dữ liệu tiếng Anh từ Wikipedia và Reddit.
Chi phí tính toán cho việc đào tạo và chạy các mô hình ngôn ngữ lớn cũng rất cao. Các ước tính đặt chi phí vận hành ChatGPT, giả sử có 10 triệu người dùng hàng tháng, ở mức 1 triệu đô la một ngày. Một giám đốc điều hành tại một công ty AI hàng đầu của Trung Quốc, người yêu cầu giấu tên, lưu ý rằng họ có kế hoạch tập trung nỗ lực vào các ngành dọc cụ thể như dịch vụ khách hàng, thay vì đánh cược vào một chatbot đàm thoại rộng hơn.
Lệnh cấm xuất khẩu chất bán dẫn tiên tiến của Washington có khả năng làm phức tạp thêm vấn đề xây dựng đủ sức mạnh tính toán cho các chương trình AI. Các quy định mới của Hoa Kỳ ngăn không cho các bộ vi xử lý như A100 của Nvidia được nhập khẩu vào Trung Quốc, khiến việc đào tạo các mô hình AI trở nên tốn kém và mất thời gian hơn.
Các nhà phân tích của Bernstein ước tính rằng các tập đoàn Trung Quốc có thể đã dự trữ đủ số lượng chip họ cần trong thời gian tới, nhưng lưu ý rằng mức trần của Washington về tốc độ của bộ vi xử lý được phép xuất khẩu sang nước này có nghĩa là các công ty AI của Trung Quốc sẽ bị bỏ lại phía sau về phần cứng. những tiến bộ.
“Sẽ rất khó để các công ty Trung Quốc có thể cạnh tranh toàn cầu,” Bernstein’s Van cho biết.
Ông nói: “Rất nhiều công ty đang đưa ra thông báo về các đối thủ của ChatGPT, nhưng điều đó không có nghĩa là họ có sản phẩm. “Thật khó để đánh giá cho đến khi chúng ta có thể thử chúng.”