תכתבו, תכתבו: מיקרוסופט הצליחה ליצור תוכנה שיכולה להאזין לאדם מדבר ולהמיר אותה לטקסט כתוב באותה יעילות כמו בן אדם שמקשיב ומקליד.

בהודעה על ההישג בבלוג שלה, ציינה מיקרוסופט כי רק לפני חודש קבעה שיא עולמי ביעילות של המרת דיבור לטקסט: שיעור של 6.3% טעויות בהבנת מילים. עתה, היא הורידה את שיעור הטעויות של המערכת ל-5.9% - שיעור זהה לזה של קלדנים מקצועיים.

החברה הגיעה להישג בעזרת שימוש במה שנקרא "רשת נוירונים" - תוכנה שלומדת קשרים בין פריטי מידע, או במקרה הזה מילים. התוכנה של מיקרוסופט יודעת למשל לקשר בין מילים נרדפות ובין מילים שסביר יותר או פחות שיופיעו ברצף. כך, במקרה של ספק, היא תנחש מה המילה שהכי סביר שאמורה להופיע במקום שבו היא התקשתה להבין את הדיבור.

שוּדוֹנג הואנג, מדען דיבור ראשי (נשבעים לכם) במיקרוסופט, אמר: "הגענו לרמה אנושית. זה הישג היסטורי". עכשיו צריכה מיקרוסופט להביא את ההישג ההיסטורי הזה לעוזרת הקולית שלה, קורטאנה. לצורך כך, תצטרך החברה לשכלל את התוכנה, משום שקורטאנה לא נהנית מתנאי המעבדה של תוכנת הבסיס, וצריכה להתמודד גם עם הצורך להקשיב לאדם אחד בתוך בליל של רעשי רקע (רחוב, אוטובוס, טלוויזיה שפועלת בבית) וגם להבין מבטאים וחיתוכי דיבור שונים ומשונים.

החברה לא ציינה כמה זמן ההתאמות האלו אמורות לקחת. רק נציין שנכון להיות שיעור הטעויות של קורטאנה, שמשולבת במכשירי ווינדוס 10 וזמינה גם כאפליקציה לאנדרואיד ולאייפון, גדול בהרבה מזה שהושג במעבדה ודומה לאלו של המתחרות - סירי של אפל ו-Now (שבקרוב יחליף אותו ברוב המכשירים Assistant) של גוגל.