DeepSeek and Market

הסבר כללי:  

מודל 1R-DeepSeek הוא מודל בינה מלאכותית מתקדם שפותח על ידי חברת DeepSeek הסינית,  המתמקד ביכולות הסקה וחשיבה. המודל מציג גישה חדשנית בתהליך האימון שלו, המשלבת למידת  חיזוק (Learning Reinforcement (עם שלבים נוספים לשיפור הביצועים גם בשלב ההרצה. השבוע  החברה גם שחררה בנוסף מודל יעיל שיוד ע לנתח תמונות ו גם לייצר תמונות (Janus(.  

שלב האימון: 

למידת חיזוק :(Learning Reinforcement (בשלב הראשון, המודל מאומן באמצעות  למידת חיזוק ללא שימוש באימון מונחה (Tuning-Fine Supervised (במהלך תהליך זה,  המודל מתוגמל על מתן תשובות נכונות, במיוחד במשימות עם תוצאות דטרמיניסטיות  

כמו בעיות מתמטיות. בנוסף, המודל מעודד לייצר מבני חשיבה מסודרים באמצעות  

תבניות מוגדרות, כגון שימוש בתגיות “<think “<ו “<answer”<-גישה זו מאפשרת למודל  לפתח יכולות חשיבה עצמאיות, כולל יצירת שרשראות חשיבה ארוכות, ביצוע אימות  

עצמי ותיקון טעויות

אימון מונחה :(Tuning-Fine Supervised (לאחר שלב למידת החיזוק, המודל עובר אימון  מונחה באמצעות מערכי נתונים איכותיים המכילים דוגמאות של שרשראות חשיבה  

ארוכות. שלב זה מסייע בשיפור הקריאות והעקביות של התגובות, ומפחית בעיות כמו  

ערבוב שפות או חזרתיות יתר

יישור להעדפות אנושיות :(Alignment Preference Human (בשלב הסופי, המודל  מותאם להעדפות אנושיות באמצעות למידת חיזוק נוספת, במטרה לשפר את היכולת  

שלו לספק תגובות “בלתי מזיקות “, ולהתאים את התגובות לציפיות המשתמשים

שלב ההרצה (הסקה Inference(: 

בשלב ההרצה, המודל משתמש ביכולות ההסקה והחשיבה שפיתח במהלך האימון  כדי לספק תשובות מעמיקות ומדויקות למגוון רחב של שאלות. המודל מסוגל לנתח  

בעיות מורכבות, ליצור שרשראות חשיבה מפורטות, לבצע אימות עצמי של התשובות,  

ולתקן טעויות במידת הצורך. יכולות אלו מאפשרות למודל להתמודד עם משימות  

בתחומים כמו מתמטיקה, תכנות, וחשיבה לוגית, ולהציג ביצועים המתחרים במודלים  

מובילים אחרים בשוק

האם המודל אכן פורץ דרך?  

  • לגבי שלב האימון הזול והיעיל, בקהילת הבינה המלאכותית העולמית עוסקת בניסיונות  לשחזר את תהליך האימון הייחודי של המודל. נדע בקרוב.  
  • לגבי שלב ההרצה ( Inference(, זה קל לבדוק, הרצתי בעצמי (מנותק מהענן והרשת) מודל מוקטן של DeepSeek על המחשב האישי שלי ( 8 מיליארד פרמטרים) עם VRAM GB,8 וזה  אכן מודל ה- LLM הכי מהיר והכי טוב שהרצתי במגבלות המחשב שלי. 

משמעויות טכנולוגיות : 

אפשרות להריץ מודלים מהירים במחשבים ומכשירים ניידים במנותק משירותי ענן.  למשל :  

תרגום מהיר של שפה והכתבה באיכות הרבה יותר גבוהה ממה שגוגל מציעה היום,  ללא שימוש בשירותי ענן.  

גלאי עשן שמזהה על פי המראה אם מדובר בעשן בישול או שריפה אמיתית ומגיב  בהתאם, כולל יצירת קשר עם שירותי החירום

תנור שמצלם את האוכל, מחליט לבד על צורת הבישול וידע מתי הוא מוכן על פי סוג  המזון שהוא זיהה והמראה של המזון בתגובה לחימום.  

כיווץ והעברת מידע מהירים ע”י אימון מהיר של מודלים על מידע בזמן אמת .  

יצירת מודל שהוא לחלוטין לא מצונזר. כיוון שמודל 1R-DeepSeek הוא קוד פתוח עם  משקולות שניתנים לשינוי, ניתן גם לשנות את תהליך היישור (alignment (שלו. המשמעות  היא שמפתחים יכולים להתאים את המודל החזק לצרכיהם כולל ביטול כל הבקרה על  התשובות ו לא רק של הצנזורה הסינית . השימושים הרעים הם אינסופיים , וניתנים לביצוע  באנונימיות על מחשב חזק ללא חיבור לרשת (עד היום מודלים הלא מצונזרים היו חלשים).  למשל:  

כתיבת מדריך מפורט ליצירת פצצה או רעל שלא ניתן לזיהוי מחומרים ביתיים.  כתיבת תוכנות שידעו לבצע Engineering Reverse לתוכנות אחרות ולשנות אותן למטרה  שלילית, או לחלופין ינסו למצוא פרצות לאתרים במגוון ענק של שיטות.  

פריצה לרכבים, באמצעות תמונה אחת של מאה רכבים, המודל יזהה את הרכבים  שלהם הכי קל עקב חולשות לפרוץ ע”י אמצעי פיזי או שידורי, ויציע הסבר מפורט ו אף  יותר מזה. לדוגמא ידוע שישנם רכבים שמגיבים לקודים מסוימים בתדר GHZ 2.4 המודל  יוכל לכתוב תוכנה שתשלח אותם לרכב שהוא יזהה כפגיע.  

שימוש אפשרי בשבבים שאינם תוצרת NVIDIA.  

המודל משתמש בשבבים תוצרת NVIDIA אך ללא שימוש ב –CUDA. יש כאילו שטענו שאולי  זה יפתח פתח לחברות אחרות להיכנס למשחק, אבל כרגע המודל ב שלב האימון מתבסס על   .NVIDIA של PTX (Parallel Thread Execu�on) 

לגבי ההרצה ולא האימון, המודל כבר עובד עם כרטיסי גרפיקה של AMD, ו-INTELמשמעויות פיננסיות:  

למשקיע לטווח ארוך, ברור שנצטרך הרבה, הרבה, הרבה יותר שבבים.  בהמשך לדוגמא הקטנה שלי, עד היום לא הייתה משמעות להכנסת  מעבד חזק ומצלמה לתנור, כי לא היה מה לעשות עם זה , לא הייתה דרך  להבין מכמה תמונות מה קורה שם . כיום זה השתנה לחלוטין. תהיה כאן  השפעה כמעט על כל תחום בחיים. מצד שני אם 30% מהעובדים יהיו  מובטלים כי הבינה המלכותית תיקח להם את העבודה, לא ברור מי יקנה  את המוצרים החכמים האלו.  

למשקיע הספקולנט שסוחר לטווח קצר, יש פה זעזוע של שוק ה-AI,  וייתכן שהשוק הכללי (וגם שוק חברות השבבים) שמתומחר גבוה ימצא  פה את הסיבה לרדת. 

All rights reserved to Talent Capital - ©2025
*Text written in masculine or feminine is addressed to all genders