אומרים שאין תחליף למראה עיניים. שלראות זה להאמין. היום זה נכון לא רק לגבי אנשים: כבר זמן רב מנסה המדע לאפשר גם למכונות לראות ולדעת לנתח את מה שהן רואות, כפי שעושה מוחנו. אך רק בשנים האחרונות הגיע תחום הראייה הממוחשבת, או Computer Vision, לשלב בו הוא בשל להמריא - וישראל ניצבת בחוד החנית שלו.

הסנונית הראשונה לפריחה הצבעונית של חברות ההיי-טק העוסקות בראייה ממוחשבת הגיעה ב-2009, לאחר שמיקרוסופט רכשה את החברה הישראלית 3DV וחתמה על הסכם שיתוף פעולה אסטרטגי עם מתחרתה המסתורית פריים-סנס. קצר לאחר מכן חשפה חברת התוכנה האמריקאית את "פרויקט נטאל" (ששמו הוחלף מאז לקינקט) - מוצר שאפשר שימוש בקונסולת המשחקים שלה, Xbox 360, ללא בקר - "הגוף שלכם הוא השלט", הכריזה.

קנדי קראש נשלטת בתנועות אוויר:

סימפוניה מתנגנת באוויר:

 

 

מאז נמצא התחום בצמיחה חסרת תקדים ומתחרותיה של מיקרוסופט עובדות במרץ על מוצרים מתחרים. פריים סנס, שעל הטכנולוגיה שלה התבסס המוצר המקורי של מיקרוסופט, אף נרכשה על ידי המתחרה המושבעת אפל בכ-350 מיליון דולר. בישראל לבדה פועלות עשרות חברות בתחום, ומחר ייערך בתל אביב זו השנה החמישית כנס IMVC - הכנס הישראלי לראייה ממוחשבת, מיוזמתם של חברת שגיבטק ודוקטור יעקב כהן ובהפקת חברת אורטרא, כאשר בשנה זו צפויה לבלוט בה מגמת שילוב אביזרי הראייה הממוחשבת בפרטי לבוש במסגרת טרנד ה"מחשוב הלביש" העולה, שהמוצר המוכר ביותר בו הוא המשקפיים החכמים של גוגל.

"כיום, האינטראקציה עם מחשוב לביש נעשית בשלוש דרכים עיקריות", אומר ל-NEXTER גדעון שמואל, מנכ"ל EyeSight, אחת החברות הישראליות הידועות בתחום הראייה הממוחשבת, שתציג את הטכנולוגיות שלה בכנס. "דרך אחת מאוד ליניארית - תזוזת עין או מצמוץ. דרך שנייה היא משטח מגע, כמו זה שנמצא בצד המשקפיים של גוגל. דרך שלישית היא קול, שהוא מאוד מאתגר בסביבה רועשת. ויש שלט - ראינו כמה מכשירים עם חוט או אביזר בלוטות' שמוחזק ביד המשתמש. זה קצת הורס את כל המטרה, כי כל המטרה במחשוב לביש היא שלא צריך להחזיק משהו ביד".

עוד ב-NEXTER:

הפתרון של אייסייט נשמע פשוט, אבל אינו כזה כלל וכלל: החברה מפתחת אלגוריתמים ממוחשבים שמאפשרים לכל מצלמה - כולל אלו הבסיסיות הנמצאות בטלפונים סלולריים מאמצע העשור הקודם - לזהות תנועות גוף של המשתמש.

"לכל המכשירים היום יש מצלמה - ולפעמים אף יותר מאחת", אומר שמואל. "הטכנולוגיה שלנו יכולה לנצל את המצלמה בלי לדרוש כוח עיבוד עוצמתי, וזה מתאים לאתגר צריכת הסוללה של המכשירים. יש לנו יכולות טובות בתחום, כולל זיהוי תנועות כשגם הרקע זז ונקודות הרקע לא קבועות". במלים אחרות: החברה מאפשרת למצלמת סמארטפון רגילה לזהות תנועות יד ואף אצבע של המשתמש גם אם הן אינן התנועה היחידה בשדה הראייה שלהן.

עוד סיפורים, סרטונים ותמונות בפייסבוק של NEXTER

גדעון שמואל, מנכ"ל EyeSight
גדעון שמואל, מנכ"ל EyeSight, ומשקפיים עם מצלמה לזיהוי מחוות

אם האפשרות לשלוט על הסמארטפון באמצעות הזזת האצבע מול המצלמה המובנית נשמעת לכם עתידנית - אתם טועים. אין דבר יותר עכשווי ממנה. בסמארטפוני הדגל האחרונים של סמסונג ו-LG הקוריאניות כבר ניתן לבצע כמה פעולות בסיסיות על ידי תנעות יד מול המצלמה הקדמית, כגון גלילה של דפי אינטרנט. הטכנולוגיה של אייסייט עצמה, הרגישה הרבה יותר מזו הנמצאת במכשירים המובילים המשווקים בישראל, משולבת בסמארטפונים של חברת אופו הסינית, במחשבים רבים של לנובו הסינית וטושיבה היפנית ועשויה להפוך בקרוב לחלק מובנה מהיכולות של שבבי חברת ARM, הנמצאים כמעט בכל סמארטפון, וחברת AMD, המייצרת את מעבדי הגרפיקה של קונסולות המשחקים של מיקרוסופט וסוני ושל מיליוני מחשבים ברחבי העולם.

בסך הכל, אומר שמואל, "אנחנו נמצאים ב-10 מיליון מכשירים מכל הסוגים. אנחנו עושים המון מחקרי משתמשים והפידבק הוא מאוד חיובי, במיוחד אפליקציות 'לינבק' (אפליקציות המיועדות למסכים גדולים ואינן דורשות הקלדה רבה) ב-PC ובטלוויזיה. המשתמשים רוצים את זה וחברות מכניסות אותנו ליותר ויותר דגמים".

השאלה היא מה עושים עם היכולת הזו במכשירים. הזזת אצבע או יד לפני מצלמת מכשיר נייד לצורך ביצוע פעולה היא יכולת נחמדה, אך כדי להתקדם יש לאפשר ביצוע פעולות רבות ומגוונות בהרבה מכך.

"מחשוב לביש שקוף צריך מצד אחד לעזור לנו ומצד שני לא להפריע בדרך", אומר לירון שר, מומחה לחווית משתמש ויועץ גוגל-גלאס, שיציג מחר את המשקפיים החכמים של ענקית האינטרנט ושימושים פוטנציאליים שלהם. "זה הרעיון של הגוגל גלאס - זה מכשיר שנמצא מעט מעל שדה הראייה שלך ומאפשר אפליקציות שעוזרות בלי להפריע". הוא מדגיש כי "יש גבול נורא דק", וכי מטרת חממת Apps4Wear שהוא מקים בימים אלה והמתרכזת בסטארט-אפים המפתחים יישומי מחשוב לביש בכלל וגוגל-גלאס בפרט, היא להמיר אפליקציות שדורשות תשומת לב רבה לכאלו המתאימות לעולם המחשוב הלביש. "אנחנו קוראים לזה אפליקיישנז פור וורבלז, או יישומים ללבישים".

הדגמה ראשונה של גוגל גלאס: 

 

ב-Apps4Wear, שמקים שר יחד עם גמבה נטוורקס וסטודיו Jhonny505, מתרכזים לא רק בפוטנציאל של ראייה ממוחשבת, אלא בניצול של כלל פוטנציאל היכולות של מחשוב לביש. "אתמול הדגמנו בכנס אור ירוק איך מחשוב לביש יכול להציל חיים. לדוגמא: לשאול את המשקפיים אם אתה אתה שיכור או יכול לנהוג, ולפי תנודות הראש אפשר יהיה לזהות את המצב הקוגניטיבי של המשתמש, לפי היכולת שלו לעמוד במקום זמן מסוים סביר. או, לדוגמא, אפליקציה שבודקת אם אתה ער בזמן נהיגה, יכולה לזהות כשאתה מוריד את הראש ומצפצפת לך באוזן חזק מאוד". דוגמא לאפליקציית ראייה ממוחשבת בסיסית יותר שפותחה בסיוע שר היא האפליקציה של תערוכת החלל הישראלית, שנערכה לפני כחודשיים. מבקרים במתחם יכלו להשתמש במשקפיים חכמים של גוגל שהובאו למתחם, זיהו את התמונות עליהן הסתכל הלובש והציגו על גביהן סרטוני וידאו רלוונטיים. "יש לזה פוטנציאל להעשיר אומנות", מדגיש שר.

אך כמו כל תחום מדעי, גם הראייה הממוחשבת ניצבת בפני אתגר משמעותי: החשש הציבורי מהרס הפרטיות בשל יכולתן של מכונות לזהות אנשים, לנתח מה הם עושים ולדווח על כך לאדונים שונים, החל מגופים המתאימים פרסומות למשתמשים ועד סוכנויות שלטוניות.

לירון שר, מייסד חממת Apps4Wear לאפליקציות גוגל-גלא
מכשירים שעוזרים בלי להפריע. לירון שר והגוגל-גלאס

"כיום אין דבר כזה פרטיות", אומר שמואל, ומוסיף מייד: "בלי קשר אלינו. נגמרה הפרטיות, ומי שחושב אחרת חי באשליה". לדבריו, בעידן בו כל אדם ברחוב מצלם תמונות ווידאו בעזרת הסמארטפון העולים לרשת בתוך שניות, בלתי אפשרי שאדם יישאר בלתי מצולם ובלתי מתועד.

שר בוטה פחות. "היום אנחנו לקראת נקודת מפנה בנושא הפרטיות", הוא אומר ומסביר: "יש מצב שתרצה לחלוק את הנתונים לטובתך האישית. לאחרונה הייתי בהרצאה של וינט סרף (ממפתחי האינטרנט שביקר לאחרונה בישראל) והוא אמר שבקרוב נראה הרבה פתרונות שיעזרו למצוא את הגבול בין פרטיות לבין חוסר פרטיות לטובת חלוקת מידע. לאט לאט נמצא יותר שיטות להבין מה לחלוק, איך לחלוק מידע ומתי".

שר בטוח שבסופו של דבר, פרטיות היא "עניין של פיתוח סטנדרטים חברתיים, כמו השלטים שנמצאים בבתי ספר ובאוטובוסים וקוראים שלא לדבר בטלפון. החברתיות שלנו תשתנה עם המכשירים". הוא מוסיף כי "כמו בסמארטפון, מה שנחלוק ישותף ומה שלא לא", ומוסיף כי לדעתו, אביזרי מחשוב לביש לא פוגעים בפרטיות יותר משימוש במצלמות נסתרות.

שמואל, לעומתו, מסתמך על איזון אחר כדי להרגיע את החששות מתיעוד מתמיד: "אנחנו 'אפליקיישן-אוור' (מודעים לאפליקציה), לא צריכים שהמצלמה תהיה דלוקה תמיד. למשל: אם אתה הולך עם המכשיר ונכנסת הודעה, אז המצלמה נדלקת רק למשך מספר שניות שבהן אתה צפוי לבחור עם להיכנס או לא להיכנס להתראה. שנית, אנחנו מעבדים 'פריים-ביי-פריים' (תמונה אחרי תמונה) - כלומר: אנחנו לא שומרים ולא מקליטים את הצילום, אלא מנתחים מה השתנה מרגע לרגע וזורקים. במשרדים שלנו יש מאגרי מידע עצומים עם מאות אלפי צילומי תנועה של העובדים שלנו, שנעשו בהסכמה, כדי לשפר את האלגוריתמים". לטענתו, השאלה האם המערכת מקליטה את המשתמש או לא לא תהווה שיקול אמתי עבור אנשים בבחירת היחס למחשוב לביש. העובדה שהמכשירים שמשלבים את הטכנולוגיה של אייסייט אינם מקליטים או שומרים היא "לא כי זה פוגע בפרטיות, אלא כי אין בזה צורך".

בסופו של דבר, למרות החששות, מאמינים גם שמואל וגם שר כי מחשוב לביש יהפוך לחלק מחיי היום-יום שלנו - וכבר בשנתיים הקרובות. המכשול העיקרי, מבחינתם, כלל אינו הפרטיות, אלא האפליקציות. "לדעתי האישית, אנשים יקנו את זה, אבל עד שלא יהיו מספיק אפליקציות אנשים לא יילכו עם זה", אומר שמואל, ושר מוסיף כי ישראל יכולה להוביל את תחום המחשוב הלביש כולו כפי שהיא מובילה את עולם ההיי-טק בכלל ועולם פיתוח הראייה הממוחשבת בפרט: "כמו שיש לנו שם כאומת הסטארט-אפים, אנחנו נהיה אומת הלבישים. אנחנו מדינה של מאמצים מוקדמים של טכנולוגיות, יותר מרוב מדינות העולם, ויש לנו גישה למוחות וטכנולוגיה. למשל, כשביקרתי לאחרונה בספרד לבוש בגוגל-גלאס הסתכלו עלי כאילו אני חייזר. אף אחד שם לא ראה גוגל גלאס, פה בישראל כבר כולם יודעים מה זה".