Opens profile photo
Follow
Nir Ben-Zvi
@nir_benz
Twin girl dad. Deep Learning Consultant. I help companies with ML & computer vision. Ex: trigo, Amazon, Disney. Also: Pizza, whisky, art.
Israelnirbenzvi.comJoined August 2014

Nir Ben-Zvi’s Tweets

וואו חלום שלי לחיות בטיימליין שבו מתקיימת ״האימפריה ההסבורגית החדשה״.
Image
6
23
גוגל ריסרצ׳ שיחררה בשקט-יחסית עוד עבודת text-to-image שמעיפה את המוח; עריכת ווידאו באמצעות מודלי דיפוזיה. יצירה של ווידאו מתוך מספר תמונות, עריכה של ווידאו באמצעות טקסט ועוד. תראו את הווידאו, ג׳יזס. כל החוקרים מגוגל ישראל ומהעברית. dreamix-video-editing.github.io
9
129
לפי דיווחים, גוגל משקיעה 300M$ (מתוך סה״כ 580M$ שהושקעו בסבב) ב-Anthropic, סטרטאפ שמפתח מודלי שפה ומתיימר להתחרות ב-OpenAI (ובדומה אליהם בתחילת הדרך, מדבר על AI safety, equality וכו׳). אגב, אפשר כבר להירשם לבטא של הגרסא שלהם ל-ChatGPT שנקראת Claude.
Quote Tweet
We're excited to use Google Cloud to train our AI systems, including Claude! anthropic.com/news/announcem
3
20
עדין פחות קר מירושלים בפברואר
Quote Tweet
הר וושינגטון בניו המפשיר, הנקודה הקרה בארהב, עלול לשבור שיא קור בשעות הקרובות, במקום שבו נמדדה הטמפרטורה הכי נמוכה. השיא עומד על 43- מעלות צלזיוס, (1934) וכרגע הטמפ מגיעה ל42- בשילוב הרוחות האדירות הטמפ מגיעה ליותר מ65- צלזיוס אפשר לעקוב בלינק למטה:
Show this thread
Embedded video
0:26
6.6M views
1
7
תגידו, מה עושים כדי שתותים יחזיקו יותר מרבע שעה אחרי שנרכשו? לחילופין: מוזמנים להיכנס איתי ברבע קילו תותים. ת״א, פרטים בפרטי.
26
43
ראיתי כאן מישהי שממש רבה בציוצים עם בוט. הן ממש צ׳ילבוט.
4
42
הגיבור שמגיע לנו
Quote Tweet
לפני איזה חודש, @ItaiS ואני ישבנו ואכלנו פיצה ועלה לנו רעיון הבא: לארגן ערב שבו שמונה אנשים עוברים בשמונה פיצריות, אוכלים סלייס אחד בכל מקום, ואז מחליטים מהי הפיצרייה הכי טובה בעיר. אז הכנתי מפה, הערב זה הערב, והגשם לא יעצור אותנו.
Show this thread
Image
13
מצטרף לממליצים, זה פרק מצוין.
Quote Tweet
לפני כמה חודשים, בזמן שהתחולל כל השיט שואו עם אילון מאסק בטוויטר, הצעתי ל @ashevat להקליט בזמן אמת את מה שעבר עליו באותם שבועות סוערים. התוצאה היא פרק לא שגרתי על אירוע לא שגרתי שקורה להמון אנשים בהזדמנויות שונות בחיים, ולא באמת מדברים עליו מספיק. bit.ly/Geekonomy675
5
לא תוצאה מפתיעה (לדעתי) אבל עדין תוצאה מעניינת; מסתבר שאפשר לשחזר בקלות יחסית תמונות מה-train set של מודלי text-to-image. מעבר לבעיית הזכויות יוצרים העצומה, זה מאתגר את התפיסה שהמודלים האלה ״לומדים ליצור״ ולא פשוט זוכרים בע״פ כל מה שהם ראו על מנת לחבר בין תמונות בצורה חכמה.
Quote Tweet
Diffusion models can be made to regurgitate training data. This adds fuel to the lawsuits Microsoft/OpenAI/StabilityAI are currently facing. And prominent AI researchers like Yann LeCun said these things get inspired like human artists do yet they are just lookup tables.
Show this thread
Image
4
14
קבוצת חוקרים מאוניברסיטת מרילנד מציעה פיתרון אלגנטי בטירוף שמאפשר לייצר watermark לטקסטים שיוצרו ע״י מודלי שפה גדולים (כלומר, מאפשר לייצר טקסט בצורה שמאפשרת לבדוק אם הוא אנושי או לא בקלות).
Quote Tweet
#OpenAI is planning to stop #ChatGPT users from making social media bots and cheating on homework by "watermarking" outputs. How well could this really work? Here's just 23 words from a 1.3B parameter watermarked LLM. We detected it with 99.999999999994% confidence. Here's how 🧵
Show this thread
Image
10
28
הייטקיסטים: פחחח איזה זוג מפגרים אין להם מושג מהחיים שלהם! גם הייטקיסטים: יש לי דיעות מוצקות על אפידמיולוגיה והמלחמה באוקראינה
Quote Tweet
ינון: "איזו הוצאת כסף מישראל? עינת גז ממש 'ענקית ההייטק', סטארט-אפ שלא הונפק. היא מפגינת שמאל מטוללת. הרפורמה תעבור, אתם יכולים לקפוץ". בן: "תבדוק קצת מה זה פאפאיה, שזה הדבר הכי מוערך היום בהייטק. היא לא הנפיקה משיקול אסטרטגי". @BenCaspit @YinonMagal
6
30
Quote Tweet
למה אני טוען ש-״פריצת הדרך המשמעותית ביותר מאחורי Dall-E 2 היא CLIP״? הגיע הזמן לשרשור על CLIP, או בשמו המלא, Contrastive Language-Image Pre-Training, והסבר על איך בעצם מגיעים דרכו מטקסט לתמונה. >>
Show this thread
1
17
Show this thread
>> מסתבר שאם נבנה מודל *חדש* כך שידע *להפוך* את הייצוג הזה חזרה לתמונות, ו*נאמן* אותו מול אותם מיליארדי תמונות ש-CLIP אומן עליהן - נקבל את היכולת לייצר תמונות חדשות עבור תיאורים שלא היו חלק מהדאטא המקורי. המודל הזה נקרא unCLIP, והתהליך כולו נקרא Dall-E 2.
Image
1
35
Show this thread
>> אז אם שכנעתי אתכם שההבנה הויזואלית של CLIP משוגעת, נשאל שאלה חדשה; מה משמעות ה״ייצוג״ של CLIP עבור משפט מורכב שמתאר סיטואציה מסוימת, שהוא לא נתקל בה? ובכן, זו שאלה טובה! >>
1
15
Show this thread
>> מסתבר ש-CLIP גם ״מבין״ מדהים את הקשר בין תיאורים גרפיים לבין איורים שלהם. קשר שנעשה בו שימוש בעבודה בשם CLIPasso, שם CLIP שימש כדי לייצר איור אבסרקטי של דימויים שונים. >>
Image
1
16
Show this thread
>> בגלל העושר העצום שקיים במאגר של מיליארדי תמונות, CLIP הוא מודל כללי שפשוט ״מבין״ תמונות. למרות שלא אומן על אף סוג ספציפי של דאטא, המודל מכיר סוגים שונים של אוכל, בעלי חיים, ביגוד, טקסטורות, סגנונות איור, כלי שיט, מפורסמים ועוד. >>
1
16
Show this thread
>> אם ניקח תמונה של גוואקמולה, יחד עם המשפט ״זוהי תמונה של גוואקמולה״ - המודל אמור לספר לנו שה״מרחק״ בניהן אפסי. כלומר, המשפט והמלל אכן מתאימים. כמובן שזה לא *כזה* פשוט וצריך לבנות את המשפט בצורה חכמה (וכמובן לבנות משפט מתאים לקטגוריות אחרות). >>
Image
2
16
Show this thread
>> מסתבר שהמודל שהתקבל בעל המון יכולות מרהיבות. למשל, zero shot. כזכור, המודל לא קיבל דאטא מתוייג והוא לא יודע מה זה כלב. אבל הוא כן יודע להתאים משפטים לתמונה מתאימה ולהיפך. >>
Image
1
16
Show this thread
>> חשוב לעצור רגע ולהבין שמדובר בטקסט חופשי ושלפעמים הקשר לתמונה קלוש. תמונה של יער שמופיעה בכתבה על פסטיבל מוזיקה? תמונה של בניין משרדים בכתבה על מסעדה חדשה? וכמובן שאותה תמונה לפעמים מופיעה מאות פעמים עם טקסטים שונים. הדאטא הזה *רועש*, אבל הוא לא דורש שום תיוג ידני. >>
Image
1
16
Show this thread
>> באו OpenAI ואמרו ״ומה אם נאמן מודל שמבין את המרחק בין תמונה לטקסט שמתאר אותה?״. אז נלקחו להן כמה מיליארדי זוגות טקסט+תמונה מרחבי האינטרנט. מודל אחד מייצר ״ייצוג״ עבור התמונה, מודל שני מייצג ״ייצוג״ עבור הטקסט, ו-CLIP מייצג עבורם ייצוגים שיהיו ״קרובים״ או ״רחוקים״ בהתאם. >>
Image
1
18
Show this thread
>> נתחיל מ״למידת מרחקים״. לפעמים נרצה מודל שמבין את הדמיון בין אובייקטים שונים מאותו ״סוג״. למשל, עבור פרצופים נרצה מודל ש״יבין״ שה״מרחק״ בין שתי תמונות של אותו אדם *קטן* מהמרחק בין שתי תמונות של אנשים שונים. נכון כשגוגל Photos מקבץ תמונות של אנשים ביחד? ככה זה קורה. >>
Image
1
21
Show this thread
למה אני טוען ש-״פריצת הדרך המשמעותית ביותר מאחורי Dall-E 2 היא CLIP״? הגיע הזמן לשרשור על CLIP, או בשמו המלא, Contrastive Language-Image Pre-Training, והסבר על איך בעצם מגיעים דרכו מטקסט לתמונה. >>
7
163
Show this thread
>> הטקסט לפעמים ״לא קשור״ לתמונה ותמונה אחת יכולה לחזור מאות פעמים עם טקסט שונה. נחזור להתחלה - OpenCLIP מגיע ל-80% הצלחה על ImageNet. עד ממש לא מזמן זו הייתה התוצאה של המודלים הטובים ביותר שאומנו על מליון תמונות ש*הותאמו ידנית* לאחת מ-1000 קטגוריות. הישג מדהים.
7
Show this thread
>> בציוץ פה מעל מוצג אימון מחדש של OpenCLIP - גרסאת קוד פתוח של CLIP (שזמין בקוד פתוח אבל ללא הדאטא עליו אומן) שאומנה מחדש על 2 מיליארד (!!!) זוגות של תמונות וטקסט חופשי שנכרו מהאינטרט. הדאטא לא אומת ולא נוקה, ובוודאי שלא תוייג באיזשהי צורה. >>
1
7
Show this thread
זירו-שוט היא היכולת לקחת מודל ML ו*ללא כל אימון מחדש* לקבל מודל שמצליח מעולה על משימה אחרת שלא אומן עליה ודורשת תיוג מורכב. על CLIP כתבתי בעבר, אבל אתזכר; זה ה״מנוע״ שמאחורי דאלי2, StableDiffusion ו-Midjourney (ובעצמו עבודה מטורפת של OpenAI). >>
Quote Tweet
We release a new ViT-G/14 CLIP model with OpenCLIP which achieves 80.1% zero-shot accuracy on ImageNet and 74.9% zero-shot image retrieval (Recall@5) on MS COCO. As of January 2023, this is the best open source CLIP model. laion.ai/blog/giant-ope huggingface.co/laion/CLIP-ViT
Image
3
28
Show this thread
ג'יזס, זו חתיכת הצהרה מהד אוף פרודקט ב-OpenAI. אבל אחרי הציוץ החמוץ של יאן לקון מישהו היה צריך להגיד את זה כבר.
Quote Tweet
On the one hand, I feel for @ylecun and Meta/Google researchers. Not seeing your research released in usable products due to big tech bureaucratic bs would be hard to stomach. Yet what they have released has been so fumbled it suggests a profound ignorance about shipping product
Show this thread
2
36
מנגד, הנקנקיות באמת צפות כשהמים רותחים.
Quote Tweet
טוב, הגיע הזמן לשבור את המיתוס המטומטם הזה: לא, לא הכי חשוך לפני עלות השחר. דווקא יש טיפה אור. ב-12 בלילה הרבה יותר חשוך. תאמינו לי, עשיתי מלא שמירות בשעות האלו
Show this thread
1
4
דל״פ (?): אלרגי לאנשים שקוראים לעצמם ״מומחה״ בכל מקום שהוא לא הלינקדאין שלהם. בפראפרזה על ת׳אצ׳ר - If you have to tell people you are, you aren't.
Quote Tweet
הוא קורא לעצמו מומחה ChatGPT 🚩🚩🚩
5
31
Imagine it's Sunday morning. You've been allowed to sleep in as long as you want, and you have no chores or responsibilities all day. There's fresh fallen snow on the ground. Your mom makes Cinnamon rolls and serves you breakfast. But you're almost 3, so you are blind with rage.
359
152.1K
Show this thread
או בחוזי עבודה, NDAs. מעוניין מאוד.
Quote Tweet
imagine a ChatGPT browser extension that reads the Terms and Conditions agreement and flags anything that is non-standard
Show this thread
3
10