פרויקט Euphonia של גוגל: מה זה ואיך זה יכול לעזור לאנשים עם דיבור לא טיפוסי - ביקורותExpert.net

תוכן העניינים:

Anonim

רוב האנשים מקשרים את חוק האמריקאים לבעלי מוגבלויות עם שינויים פיזיים ותשתיתיים שצריך לבצע בבניינים או במקומות אחרים, אך מכיוון שההגדרה של נכות מתרחבת, אנשים מבינים ש'נגיש 'חל גם על דברים כמו אתרים וזיהוי קולי.

במקרה זה, ענקית הטכנולוגיה גוגל עושה מאמץ לשפר את תוכנת הזיהוי הקולי שלה באמצעות Project Euphonia. Project Euphonia היא יוזמה להקלטת דגימות קוליות של מתנדבים ולנתח אותן כך שאנשים עם ALS, הפרעות נוירולוגיות וקשיי דיבור אחרים יכולים לנצל את המכשירים החכמים שלהם בקלות של אדם 'טיפוסי'.

למה התנדבתי

חוט הקול השמאלי המשותק ולשון אסימטרית עקב גידול במוח גרמו למחלת הדיבור שלי דיסארתריה. הדיבור המטושטש שלי והקול הקלוש שלי מקשים על חברים ובני משפחה להבין או לשמוע אותי-במיוחד במרחב הומה אדם. זה הפך אותי למועמד מוביל לפרויקט Euphonia, אז התנדבתי ברגע שקראתי על זה. בהקלטת דוגמאות באתר בסיסי, חזרתי על 4,500 ביטויים מ'איך מגיעים אל Mountain View, קליפורניה? 'ל'שחק שירים של Cardi B'.

מלבד העמידה בקריטריונים של פרויקט אופוניה, התנדבתי כי התוודעתי לראשונה לתוכנית זיהוי הקול המוביל דרקון בטבעיות בשנת 1997-וזה נכשל בצורה מרהיבה. במהלך השנים ניסיתי תוכניות מקבילות במעבדת הטכנולוגיה המסייעת בבית החולים לילדים בבוסטון וכן גרסאות מעודכנות של דְרָקוֹן, ולמרות שהתוכנה הזו עשתה צעדים גדולים, היא עדיין מתקשה לאתר את הקול שלי.

זה בעייתי משתי סיבות: אני כותב עם חוסר מוטוריקה עדינה, אז אני מקליד ביד אחת, או לאט עם שתיים אם אני עייף. עם שלושה ספרי שירים בהוצאה עצמית, ספר זיכרונות ואוסף של סיפורים מקושרים שלא פורסמו לשמי, אני מצטמרר לחשוב כמה יכולתי לייצר יותר אם הקלדה אינה משימה כה מאומצת מבחינה פיזית.

הסיבה השנייה לכך שזיהוי קולי לא ברמה יוצר עבורי מחסום הוא בגלל ריבוי המוצרים המותאמים לקול בבתים ובטלפונים. עצם השימוש בסיפור שלי, אילו יכולתי לגשת למחשבים ולמכשירים חכמים כפי שהם אמורים לשמש, זה ייתן לי יותר זמן פנוי, יאפשר לי לבצע משימות במלואן ואולי לשנות את אורח חיי.

פרויקט Euphonia: איך זה עובד?

אז איך עובדת Euphonia? לאחר שהורדתי לטלפון שלי אפליקציית אב טיפוס עם מודל זיהוי דיבור מותאם אישית, הנחתי את הטלפון ליד המחשב הנייד שלי, והכתיבתי לתוכו; כשעשיתי זאת, צפיתי בכל מה שאמרתי מופיע ב- Google Doc שלי במחשב הנייד שלי. עשיתי את זה במשך כמה חודשים, הקלטתי ביטויים מתוך רומן שכתבתי ותיקנתי כל אי דיוקים של Google באמצעות האפליקציה.

לאחר מספר חודשים נוספים ללא הקלטת ביטויים, סיימתי את הטיוטה הראשונה של רומן - 20,000 מילים - באמצעות האפליקציה. אין זה אומר שזה מושלם; על כל שעה שאני כותב, אני צריך לחזור ולבלות שעה בתיקונים קלים. אבל לא אכפת לי מכיוון שאופוניה נמצאת בשלב בטא ובמקום לחטוף באיטיות 100 מילים ביום, אני מייצר 500 מילים ביום.

ואז העובדה שאופוניה לא נועדה לעיבוד תמלילים - היא יותר לפקודות הצהרתיות - וסגנון הכתיבה שלי הוא מה שהם מכנים 'מכנסיים' (עף ליד מושב המכנסיים שלך), כך שיש לי הרבה הפסקות כי אני לא יודע איך משפט יסתיים - אתה יודע, כמו מייקל סקוט. כשאני יודע מה אני רוצה להגיד, כמו בטקסטים, מיילים או מתן הנחיות לעוזרת שלי, זה ללא ספק זיהוי הדיבור המדויק ביותר שאי פעם השתמשתי בו.

כאשר מוסדות כמו גוגל נותנים קול לנכים בעיצוב הארכיטקטורה של העתיד, נותנים להם להישאר עצמם במקום לנסות להפוך אותם למשהו 'נורמלי', זה נותן לי תקווה שבעידן ה- AI ההומניזם ינצח.

אם ברצונך לבקר באתר Project Euphonia, או שיש לך ליקוי בדיבור ורוצה לתרום דוגמא קולית תוכל להיכנס לקישור הזה: https://sites.research.google/euphonia/about/