آسیانیوز ایران؛ سرویس علم و تکنولوژی: در 48 ساعت گذشته جهان زیرورو شده و سهام فناوری یک تریلیون دلار
از دست داد ؛ با اتفاقی که افتاده امریکا دیگر آنطور که ادعا می کند تنها متولی یا
رهبر هوش مصنوعی در دنیا نیست و هم زمان، هند نیز با این واقعیت مواجه شد که نباید
خود را در حال رقابت شانه به شانه در مسابقه تسلیحاتی هوش مصنوعی بداند. همه این
اتفاق های بزرگ تنها به دلیل یک تحقیق کوچک و تولد هوش مصنوعی دیپ سیک(DeepSeek) رخ داده است که
پس از موفقیت دو روز گذشته، حالا شرکت Deep Seek در مظان اتهام تقلب از سوی رقبای امریکایی خود قرار گرفته است.
تقلبی به نام تقطیر دانش
«دیوید ساکس»، تزار رمزارز و هوش مصنوعی دولت امریکا در مصاحبه
جدید خود از شواهد قابل توجهی خبر داده که نشان می دهد شرکت چینی DeepSeek از هوش مصنوعی OpenAI برای آموزش مدل
های خود استفاده کرده است. وی بدون اشاره به این شواهد، تنها توضیح داد این احتمال
وجود دارد که مدل های دیپ سیک از طریق «تقطیر دانش»، اطلاعات لازم برای آموزش را
از مدل های OpenAI دریافت کرده باشند.(در دنیای
یادگیری ماشین(ML)، به فرآیند انتقال دانش از یک مدل نسبتا بزرگ به یک مدل کوچک،
تقطیر دانش (Knowledge distillation) گفته می شود). «اپن ای آی» هم در بیانیه ای چین را متهم به تقلب کرده و یادآور شد:
ما به عنوان سازنده پیشرو هوش مصنوعی، اقدامات متقابلی را برای محافظت از مالکیت
های معنوی خود انجام می دهیم تا رقبای فناوری امریکا، آنها را در اختیار نگیرند.
درحالی شاهد این صحبت ها هستیم که تقطیر دانش، موضوعی عادی در دنیای یادگیری ماشین
است.
ظهور از دنیای مالی
فارغ از واکنش های رقبای دنیای هوش مصنوعی به دیپ سیک، شاید شناختن
کسی که پشت یک تحقیق کوچک اما با تاثیر بزرگ در جهان قرار دارد، چندان خالی از لطف
نباشد.هوش مصنوعی چینی که سیلیکون ولی و واشنگتن دی سی را تکان داده، یک سال پیش
توسط «لیانگ ونفنگ» متولد شد و حالا به یک رقیب جدی برای OpenAI تبدیل شده و ابرقدرت های هوش مصنوعی و سلطه امریکا در فناوری را به
چالش کشیده است. در واقع نحوه عملکرد مدل DeepSeek R1 در معیارهای جهانی، ونفنگ را به «سم آلتمن» چین تبدیل کرده است آن
هم در شرایطی که امریکا همه تلاش خود را برای محدود کردن دسترسی چین به تراشه های
هوش مصنوعی به کار گرفته است. در چنین وضعیتی، ظهور DeepSeek نشان می دهد که چگونه تکنیک های نوآورانه و راه حل های مقرون به
صرفه، می تواند با وجود محدودیت ها، غول های یک فناوری را کنار بزند.
برخلاف ستاره های «سیلیکون ولی» که در فناوری پیشینه ای قوی دارند،
«ونفنگ» از دنیای مالی می آید. ونفنگ 40ساله یک بنیانگذار فناوری معمولی نیست و
همین مشخصات، وی را جالب تر می کند. وی که حالا دیگر به یکی از ثروتمندان جهان
تبدیل شده، سال 1985 در Zhanjiang، شهری فقیر در استان جنوبی گوانگدونگ چین به دنیا آمد. پدرش معلم
دبستان بود و وی مهندسی الکترونیک را در دانشگاه ژجیانگ، یک کالج معتبر در شهر
هانگژو، به پایان رساند. وی همچنین مدرک کارشناسی ارشد خود را در مهندسی اطلاعات و
ارتباطات در آنجا گرفت.
پس از فارغ التحصیلی از دانشگاه ژجیانگ، صندوق سرمایه گذاری High-Flyer را در سال 2015
تاسیس کرد که برخلاف تحلیل انسانی، از الگوریتم های پیچیده ریاضی برای معاملات
استفاده می کند. به لطف مدل سرمایه گذاری منحصر به فرد و علاقه اش به پیش بینی
روند بازار با استفاده از هوش مصنوعی، توانست پروژه های هوش مصنوعی را بدون فشار
سرمایه گذاران خارجی، با اولویت بندی دنبال کند. پرتفوی این صندوق تا پایان سال
2021 به بیش از 100 میلیارد یوآن (13.79 میلیارد دلار) رسید اما وی در آوریل 2023،
در حساب وی چت خود اعلام کرد وظایفش را فراتر از صنعت سرمایه گذاری گسترش خواهد
داد و منابع را برای AGI (هوش عمومی مصنوعی) متمرکز خواهد کرد؛ در نهایت هم DeepSeek یک ماه بعد
ایجاد شد.
احتکار تراشه های انویدیا
یکی از کارهای وی که برای بسیاری عجیب به نظر می رسید این بود که در
سال 2021، مدت ها قبل از اینکه دولت بایدن عرضه تراشه های هوش مصنوعی پیشرفته به
چین را محدود کند، شروع به خرید هزاران تراشه انویدیا به عنوان بخشی از یک پروژه
جانبی هوش مصنوعی کرد. در آن زمان بسیاری به کارهای وی با دیده تردید نگاه می
کردند و هیچ کس فکرش را هم نمی کرد که کار «ونفنگ» برای احتکار پردازنده های
گرافیکی منطقی باشد. تا زمانی که ونفنگ DeepSeek را در سال 2023 راه اندازی کرد، هیچ برنامه مشخصی وجود نداشت و
همین امر باعث شده بود تا بسیاری، وی را فردی بی توجه به امور مالی بدانند.
وی ازسوی همکارانش به عنوان فردی کم حرف، عصبی با یک مدل موی نه
چندان محبوب توصیف می شود. یکی از شرکای تجاری لیانگ در مصاحبه ای با فایننشال
تایمز گفت: وقتی وی درباره ساخت یک خوشه 10000 تراشه ای برای آموزش مدل های خود
صحبت می کرد ما او را جدی نگرفتیم. او نمی توانست دیدگاه خود را بیان کند جز اینکه
بگوید: «من می خواهم این را بسازم و این یک تغییر بازی خواهد بود.» ما فکر می
کردیم که این کار فقط توسط غول هایی مانند بایت دنس و علی بابا در چین امکانپذیر
است ولی حالا از اتفاقات چند روز اخیر شگفت زده هستیم.
جذب استعدادهای چینی
اگرچه دیپ سیک در ابتدا یک پروژه جانبی بود، «ونفنگ» علاقه زیادی
به هوش مصنوعی داشت و شخصا در این استارتاپ با تمرکز عمده بر تحقیق و توسعه،
مشارکت داشت. در واقع وی دیپ سیک را به عنوان یک رهبر داخلی در هوش مصنوعی تصور می
کرد که می تواند با بزرگ ترین شرکت های فناوری چین و همچنین شرکت های بزرگ فناوری
امریکا رقابت کند.جالب اینجاست که ونفنگ برای تشکیل تیمی از محققان هوش مصنوعی،
استعدادهای جوان برتر را تنها از دانشگاه های محلی چین به خدمت گرفت و به فراتر از
چین نگاه نکرد. وی حقوقی همتراز با آنچه شرکت های فناوری چینی مانند بایت دنس می
پردازند، برای آنها تعیین کرد تا با این استراتژی، بتواند بهترین استعدادها را از
چین جذب کند؛ افرادی که ممکن است تجربه چندانی در ساخت هوش مصنوعی نداشته باشند
اما دارای مهارت های فنی لازم برای توسعه هوش مصنوعی باشند.
استفاده از مدل متن باز
چانگ
زو، دانشیار دانشگاه سیدنی که در یادگیری ماشین و بینایی کامپیوتر تخصص دارد، گفت:
دلیل موفقیت دیپ سیک، استفاده از متن باز است که می تواند منجر به بزرگ ترین تغییر
در صنعت هوش مصنوعی شود. وی با مقایسه بازار گوشی های هوشمند، جایی که رقابت بین
سیستم بسته و پلتفرم های منبع باز مانند اندروید وجود دارد، یادآورشد: فکر می کنم
این در واقع نوعی شروع دوران اندروید برای مدل های بزرگ تر هوش مصنوعی است که توسط
دیپ سیک مشخص شده است. بنابراین چهارچوب متن باز آن برای یادگیری تفاوت ها با
پردازنده های بسته مانند «اپن ای آی» و مدل های بزرگ هوش مصنوعی گوگل، کاملا موفق
است و ما می توانیم آزادی دسترسی به مدل ساختمان تحقیقاتی را داشته باشیم.
راهی که دیپ سیک پیمود
اولین
مدل هوش مصنوعی دیپ سیک، DeepSeek
Coder بود
که در نوامبر 2023 به عنوان یک مدل متن باز برای کارهای کدنویسی طراحی شد. به
دنبال آن DeepSeek LLM،با هدف رقابت
با سایر مدل های زبانی بزرگ(LLM) دنبال شد. در ماه مه2024،
DeepSeek-V2 منتشر شد که به دلیل
عملکرد قوی و هزینه کم با استقبال خوبی روبه رو شد. این جنگ قیمتی، غول های بزرگ
فناوری چینی مانند بایت دنس، تنسنت، بایدو و علی بابا را مجبور کرد قیمت مدل های
هوش مصنوعی خود را کاهش دهند.پس از آن از DeepSeek-Coder-V2 به عنوان مدلی بسیار پیشرفته تر با 236 میلیارد پارامتر
که برای چالش های کدنویسی پیچیده طراحی شده که تا 128 هزار توکن دارد، رونمایی شد.
این مدل از طریق یک API مقرون به صرفه با قیمت
0.14 دلار برای هر میلیون توکن ورودی و 0.28 دلار برای هر میلیون توکن خروجی در
دسترس قرار گرفت. اما برگ برنده «ونفنگ»، DeepSeek-R1 بود که در ژانویه 2025 منتشر شد و
بر وظایف استدلال تمرکز داشت. این هوش مصنوعی توانست تنها با هزینه 5.6 میلیون دلار و تیمی متشکل از 200
نفر، هوش مصنوعی GPT-4 مربوط به شرکت «اپن ای
آی» را به چالش بکشد. هزینه کم این عملیات، سیلیکون ولی را شوکه کرد و در کمترین
زمان، برنامه DeepSeek با کنار زدن چت جی پی تی،
محبوب ترین برنامه فروشگاه های اپ در امریکا شد.