mako
פרסומת

הדור הבא של מצלמות האבטחה יוכל גם לקרוא את השפתיים שלכם

מדענים עובדים על השלב הבא של הטכנולוגיה, שתוכל לתרגם דיבור מסרטוני מצלמות במעגל סגור. רגולטור הפרטיות הבריטי: "הטכנולוגיה לקריאת שפתיים תשנה את האופי של החברה שלנו"

סוכנויות הידיעות
TheMarker
פורסם:
גבר לוחש
גבר לוחש | צילום: Diego Cervo, ShutterStock
הקישור הועתק

טכנולוגיית קריאת שפתיים חדשה תגרום לאנשים "לכסות את פיותיהם" כשהם משוחחים ביניהם ברחוב - כך אמר הרגולטור הבריטי לפרטיות, טוני פורטר. הוא הביע חשש לגבי תוכנות לקריאת שפתיים שיכולות לפענח מה שאנשים אומרים ממרחק, או טכנולוגיות שיכולות לזהות אנשים לפי צורת הליכתם.

"ליכולת של הטכנולוגיה לקריאת שפתיים לקבוע מה אנשים אומרים תהיה השפעה מדכאת. היא תשנה את האופי של החברה שלנו", אמר פורטר ל"איבנינג סטנדרד". לדבריו, "אנשים ירגישו שאינם יכולים לנהל שיחה בחוץ. אנו רואים את מנהלי קבוצות הכדורגל מכסים את פיותיהם כשהם מנחים את השחקנים כדי שלא יקראו את שפתותיהם. הכפילו זאת במיליוני בני אדם".

אמירותיו של פורטר באו בעקבות השקה של חקירה רשמית לגבי השימוש בטכנולוגיית זיהוי פנים על ידי משטרת מטרופוליטן, על ידי הנציבה למידע אליזבת דנהם, שאמרה כי המשרד שלה "מודאג מאוד" מהתוכנה. ארגון זכויות האזרח ביג ברדר ווץ' הזהיר באוגוסט כי חשף "מגפה" של שימוש בטכנולוגיות זיהוי פנים במרכזי קניות, מוזיאונים ואולמות כנסים בבריטניה.

עם זאת, פורטר אמר כי הטכנולוגיות האלה יכולות ליהפך לכלי חשוב של רשויות החוק. הוא הוסיף כי "חשוב להגן על חברה פתוחה וחופשית, מאחר שכיום אנו בסכנה של ויתור על החופש שלנו לטובת הטכנולוגיה. ג'ורג' אורוול הוציא לאור את '1984' לפני 70 שנה, ועדיין רלוונטי לומר שאנו חייבים להקשיב לאזהרות ולהתעקש על כך שאיננו רוצים חברה כזאת".

פרסומת

מדענים באוניברסיטת איסט אנגליה בנוריץ' עובדים כיום על השלב הבא של טכנולוגיית קריאת שפתיים אוטומטית, שתוכל לתרגם דיבור מסרטוני מעקב ממצלמות במעגל סגור. טכנולוגיית זיהוי הדיבור הוויזואלי - שנוצרה על ידי ד"ר הלן בר ופרופסור ריצ'רד הארווי מבית הספר למדעי המחשב של איחוד האמירויות - יכולה לשמש ב"כל מקום שבו הקול אינו ברור דיו כדי לקבוע מה אנשים אומרים", אמרה בר.

הטכנולוגיה משתמשת ברשתות נוירולוגיות עמוקות ש"לומדות" את הדרך שבה אנשים מזיזים את השפתיים שלהם, הסביר הארווי. החוקרים מאמנים את המערכת באמצעות שימוש בתנועות שפתיים של אדם כלשהו, ואז בוחנים אותה על תנועות שפתיים של אדם אחר. ניתן יהיה להשתמש בטכנולוגיה גם כאשר איכות הקול טובה אך יש רעשי סביבה שמקשים על השמיעה.

עוד ב-TheMarker

פרסומת

לצוות יש מאגר נתונים של 12 אנשים כרגע, והם משתמשים בקובץ המכיל כ-1,000 מלים. זה מייצר שיעור הצלחה של 80% במקרה של דובר אחד, ו-60% במקרה של שני דוברים. מאפיין במודל השפה גם מסייע לאמן את המחשב לזהות את התוכן של המלים.