حتماً قبلاً هم مشابه این جمله را شنیدهاید: تازه بعد از ورود فناوری به زندگیمان است که ضرورت وجودش را حس میکنیم و حتماً بارها فیلمهای متعدد علمیتخیلی را دیدهاید که در طی دهههای مختلف اوج تخیل نویسنده و فیلمسازان محسوب میشدند؛ بهگونهای که اگر از واقعیت آنها صحبت میکردید، شوخی بزرگی محسوب میشد.
بازوی مصنوعی روباتیک
دانشگاه جان هاپکینز و مؤسسه DEKA
یکی از عواملی که سالهای مدیدی است جامعه بشری با آن دست به گریبان بوده و هست، نقص عضو است. در حال حاضر، حداقل دو نهاد عمده را میتوان نام برد که در این زمینه به پیشرفتهای قابل توجهی دست پیدا کردهاند، یکی مؤسسه تحقیقاتی DEKA تحت سرپرستی دین کَمن مخترع (مشهور به سازنده وسیله نقلیه الکتریکی Segway Personal Transporter) و دیگری آزمایشگاه فیزیک کاربردی (APL) دانشگاه جان هاپکینز که با سرپرستی بیش از سی سازمان مختلف در قالب یک مؤسسه مجازی، در این حوزه مشغول فعالیت هستند.
در طول این دوره دوساله، دو نهاد مذکور رقابتهای خیلی دوستانهای را تجربه کردند. نمونههای جدید اندام مصنوعی – که در حال حاضر در آزمایشگاههای پزشکی هستند– شگفتیهای مهندسی محسوب میشوند و نسبت به اعضای مصنوعی فعلی (که فقط قابلیت انجام سه نوع حرکت را دارند) حرکتهای بسیار بیشتری را ممکن میسازند.
هدف اصلی، ساخت عضوی مصنوعی با اندازه، وزن و چالاکی عضو اصلی است. این یعنی قابلیت انجام حرکتهای مختلف بهصورت پیوسته و همزمان. بنابراین بیمار مورد نظر دیگر مجبور نیست بهعنوان مثال، میان خم کردن آرنج و حرکت دادن انگشتها یکی را انتخاب کند؛ بلکه قادر است هر دو را بهصورت همزمان انجام دهد.
و جالبتر آنکه، با ورود هر دو مؤسسه به مرحله بعدی تحقیقات خود در سال 2009، اعضای مصنوعی میتوانند از طریق تحریک عصبهای ماهیچه موردنظر، با پایانههای عصبی فرد معلول تقابل داشتهباشند. این روش در دانشگاه نورثوسترن و بنیاد توانبخشی شیکاگو، بهمنظور تحریک عضلات استفادهنشده به کمک سیگنالهای عصبی و کنترل مستقیم دست و انگشتان مصنوعی توسعه پیدا کردهاست.
استوارت هارشبرگر، سرپرست گروه APL میگوید: «اگر کسی بازویش را در قسمتی نزدیکتر به مفصل اصلی از دست دادهباشد، گزینههای بیشتری برای کنترل یک دست مصنوعی در اختیار او قرار میگیرد.» او در ادامه توضیح میدهد: «اگر عضلهای موجود نباشد، باید سراغ خود دستگاه عصبی رفت.»
در APL از سنسورهای مایوالکتریک قابلتزریق (IMES) داخل ماهیچه استفاده میشود تا بتوان به این روش از فعالیتهای الکتریکی درون ساختار ماهیچه برای کنترل بیسیم بازوی مصنوعی استفاده كرد. IMES بهزودی برای کسب مجوز به FDA (سازمان مدیریت سلامت دارویی و غذایی) فرستادهمیشود. چنانکه هارشبرگر میگوید: «من گمان میکنم که بعد از طی این فرآیند تولید دوساله، شاهد یک سیستم عضوی بسیار سودمند باشیم.»
در نهایت، قرار است این پیشرفتها امکان تقابل با خود مغز را بهدنبال داشتهباشند؛ هدفی که DEKA و APL بهدنبال آن هستند. دستیابی به این هدف، تنها گزینه موجود برای معلولانی است که نقص نخاعی دارند.
عمدهترین هدف DEKA راحتی معلولان است. محققان دریافتهاند که تعدادی از معلولان از اندام مصنوعی خود استفاده نمیکنند، زیرا پوشیدن آنها برایشان دردآور است. اتصال بیش از حد محکم این اعضا، باعث اعمال فشاری مداوم میشود.
هر کدام از این اعضای مصنوعی 75 تا 100هزار دلار قیمت دارند. اما دستکم، سطح بالاتری از کارایی که توسط فناوریهای جدید حاصل میشود، این سرمایهگذاری را سودمندتر و رضایتبخشتر میکند.
بینی الکترونیکی
برکلی
بهزودی روزی خواهدرسید که یخچال یا حتی بطری نوشیدنی هنگام فاسد شدن محتویات درونشان شما را مطلع میکنند. البته، این روش هنگامی که با مواد غذایی یا دارویی سر و کار داشته باشید، ارجحیت بسیار بیشتری نسبت به عبارت «بهترین تاریخ مصرف تا...» پیدا میکند. این بستههای هوشمند از همان روش شما استفاده میکنند؛ یعنی بو کشیدن محتویات درون بسته.
شاید باور کردنی نباشد، اما فناوری بینی الکترونیک یا E-Nose چندین سال است که مطرح و روی آن کار شده و حتی ایده اولیه آن به چند دهه قبل باز میگردد. بینیهای الکترونیک امروزی، قادر به تشخیص گازهای پرخطری هستند که ما نمیتوانیم احساسشان کنیم. آنها در بیمارستانها، نهادهای نظامی و... استفاده میشوند.
بنابراین، سؤال اصلی این است که نسل بعدی بوکنندههای دیجیتالی چه زمانی برای تولید آماده میشوند؟ نخست اینکه، آنها قرار است از پلیمرهای ارگانیک چاپشده ساخته شوند که توسط پرینترهای جوهرافشان مخصوص چاپ شدهاند. دوم اینکه، این پلیمرها باعث خواهندشد که پیشبینیهای الکترونیک نسبت به انواع امروزی که به اندازه چندصد یا حتی چندهزار دلار هزینهبر هستند، کاهش قیمت قابلتوجهی پیدا کنند.
ویوِک سابرامانیان، استادیار دپارتمان مهندسی برق و علوم کامپیوتر دانشگاه کالیفرنیا، میگوید: «گروهی از داوطلبان رشتههای مختلف مقطع دکترا از حوزههای مختلف شیمی گرفته تا مهندسی برق و علوم شناخت مواد اولیه جمع شده و خودشان پرینترهای پلیمری را میسازند و مرتب با آنها پرینت میگیرند.»
فقط انتظار نداشتهباشید که به این زودیها بتوانید بینی الکترونیکی بخرید که قادر باشد تمام ده هزار رایحهای که بینی انسان میتواند احساس کند، تشخیص دهد.
ترفند اصلی این است که به آن یاد دهند چه موارد خاصی را تشخیص دهد. چنانکه سابرامانیان میگوید: «من میدانم که چه بویی را باید حس کنم؛ بوی مواد فاسدشده را. بنابراین میتوانم یک بینی الکترونیک ویژه برای تشخیص فاسدشدن مواد داشتهباشم.»
اصل قضیه، شناسایی مواد فاسد است. اما او یادآوری میکند که تا شناسایی مواد خاص، مانند انواع مواد مخدر یا حس بوی بمب فاصله زیادی داریم که برای بوییدن بمب باید میان میلیونها مورد شناسایی کنیم که این کار واقعاً مشکل است. بنابراین، بهتر است فعلاً به تعلیم سگها ادامه داد.
سابرامانیان معتقد است هر روز حجم زیادی از غذا دور ریخته میشود؛ در حالی که تا فاسد شدن فاصله زیادی دارند. این دور ریزی غذا به این دلیل است که تاریخ انقضا، به ناچار تا حد زیادی محافظهکارانه تعیین و روی کالا درج شده است. این موادی که بیهوده اسراف میشوند، با وجود بینی الکترونیکی میتوانند به مصرف درستی برسند.
تصور او از مدل تجاری بینی الکترونیکی قطعهای پلاستیکی ساختهشده از پلیمر ارزانقیمت است که مدارهای مربوط روی آن چاپ شدهاند. این قطعه به یک پردازنده سیگنالی کوچک متصل خواهدبود که احتمالاً با یک باتری قابلچاپ، خارج از بسته غذا کار میکند.
سیگنال خروجی، نشاندهنده فاسد یا سالم بودن غذای داخل بسته است که میتواند از طریق فرکانس رادیویی فرستادهشود. طبیعتاً بینیهای الکترونیکی که در انبارها استفاده میشوند، باید برچسبهای RFID را داشته باشند. تغییر رنگ در پلیمر نشاندهنده وضعیت محتویات بسته خواهدبود.
محققان دیگر روی استفاده از ذرات نانو جهت چاپ پلیمرهای دقیقتر کار میکنند. سابرامانیان فکر میکند که روزی، بهترین بینیهای الکترونیکی از سنسورهای مستقلی بهره خواهندبرد که با ترکیب چندین روش مختلف ساخته خواهندشد و با ترکیب و تطابق انواع مختلفی از الگوهای رایحهشناسی، به بوهای مختلف واکنش نشان خواهندداد.
چنانکه سابرامانیان میگوید: «بینیهای الکترونیکی صحنه رقابت شگفتانگیزی در زمینه چاپ خواهدبود. شما هر روز در خانه روی مواد مختلف پرینت میگیرید تا رنگهای موجود در عکسها را بهدست آورید و ما فقط سنسورها را جایگزین رنگها خواهیمکرد.»
صفحهنمایش لمسی «شفافنما»
واحد تحقیقات مایکروسافت
محققان مایکروسافت، بخش قابل توجهی از فضای موجود روی تجهیزات دستی را هدررفته میدانند. کدام بخش؟ اگر یکی از آنها را بچرخانید متوجه خواهیدشد. تلفن همراه یا کنسول دستی را تصور کنید فشار انگشت شما روی سطح پشتی خود را بهعنوان ورودی دریافت کند. حتی با وجود اینکه انگشتانتان در پشت دستگاه مخفی هستند باز هم میدانید که چه میکنید، زیرا هالهای از انگشتانتان را میبینید.
پاتریک بادیش، هنگامی که در حال کار با صفحهنمایش لمسیاش بود و انگشتش مانع دیدن بخشی از خود صفحه میشد، ایده LucidTouch به ذهنش رسید. خوشبختانه او سمتی داشت بود که بتواند ایدهاش را به ثمر برساند. او یکی از چهار محققی است که در واحد تحقیقات مایکروسافت (MSR)، در گروه تحقیقاتی سیستمهای تطبیقپذیر و روشهای تعاملی فعالیت میکند.
تمرکز او در چند سال اخیر، روی روشهای تعامل در تجهیزات همراه بودهاست؛ بهخصوص غلبه بر مشکل محدودیتهای صفحهنمایشهای کوچک. دستگاههای کوچک و کوچکتر خواسته همیشگی ما بودهاست، اما کوچکتر شدن تاچاسکرین از بهرهوری دستگاه میکاهد. بادیش تا سال 2006 در آزمایشگاههای تحقیقاتی میتسوبیشی الکتریک (MERL) روی لوسیدتاچ(Lucid Touch) کار میکرد.
بادیش فکر میکند، استفاده از پشت صفحهنمایش لمسی بهعنوان سطح حساس بهلمس، تنها راه ایجاد تسلط کافی روی آن است. البته، بهشرطی که کاربر بتواند با دیدن انگشت خود، کنترلش را روی دستگاه حفظ کند. بادیش لوسیدتاچی را که در نظر دارد، «شفافنما» یا «شفاف کاذب» مینامد.
بادیش میگوید: «با وجود امکان تعامل با سطح پشتی، در حقیقت ما انگشتها را از جلوی دید کاربر محو میکنیم. همزمان که سطح پشتی را لمس میکنید، محتویات خود را بهصورت کامل روی صفحهنمایش میبینید.
دقیقاً انگار که سطح رویی را لمس میکنید.» لمس پشت دستگاه، باعث میشود که اندازه انگشتان کاربر نقشی در تقابل او با دستگاه نداشتهباشند. حتی بزرگترین انگشتان نیز میتوانند بدون ایجاد اختلال در دید کاربر، با دستگاه کار کنند.
بادیش در ادامه توضیح میدهد: «کاربران خیلــی سریــع متوجــه ماجــرا خواهندشــد.» شفافنمایی آنقدر واضح است که نیازی نیست آن را به کاربران مبتدی آموزش و توضیح بدهیم. یک نقطه رنگی روی صفحه نشاندهنده محل دقیق تقابل هر انگشت خواهدبود.
مثل آن است که هشت نشانگر ماوس را بهصورت همزمان تحت کنترل خود داشتهباشید. نقطه مذکور میتواند به کوچکی یک پیکسل باشد و همچنین میتواند بهمحض برقراری تماس کاربر با سطح پشتی تغییررنگ پیدا کند.
اما لوسیدتاچ چگونه میتواند این شفافنمایی را به صفحهنمایش تجهیزات دستی ببخشد؟ نمونه اولیه از یک قطعه الصاقی حجیم دوربینمانند استفاده میکند که رد انگشت کاربر را میگیرد و مکان آن را به صفحه منتقل میکند.
اما در نهایت، یک سری سنسور نوری یا خازنی میتوانند انجام این ترفند را بهعهده بگیرند. اصل قضیه این است که فقط مقدار دادهای که برای شناسایی مکان دقیق انگشتها لازم است، از سنسورها دریافت شود.
در حال حاضر، اینکه کاربر چه کارهایی با انگشتش انجام میدهد، در مرحله تحقیق است. گروه تحقیقاتی همچنین یک صفحهکلید استاندارد را روی صفحهنمایش آزمایش کردهاند. اما مهم راحتی کاربر است و اینکه چه حالتی بهترین حالت برای کاربر است.
بادیش، کاربرد لوسیدتاچ را فقط محدود به وسیلهای برای تعامل با تجهیزات همراه نمیداند. تصور کنید که بتوانید از کنترلهای پشتی کنسول PSP خود برای یک بازی RTS (استراتژی بیدرنگ) استفاده کنید و کنترلهای چندانگشتی با اعمال یکسری فیلترهای خاص میتواند برای کاربرانی با محدودیت جسمی، بهخصوص مبتلایان به پارکینسون مفید باشند. لوسیدتاچ حتی میتواند پایهای برای یک واسطه صفحهکلید/ماوس جهت استفاده در هر دستگاهی، از کوچکترین تلفن همراه گرفته تا قدرتمندترین کامپیوتر باشد.
دستگرفتنیها
آزمایشگاه رسانه MIT
وسیلهای را تصور کنید که وقتی آن را بهگوش خود بچسبانید یک تلفن همراه باشد؛ هنگامی که به چشمانتان بچسبانید یک دوربین و هنگامی که در دو دست خود بگیرید یک کنسول بازی دستی باشد. یک دستگاه واحد که عملکردش براساس طرز قرار گرفتن در دستان کاربر تغییر کند.
این ایدهای است که پشت وسیلهای موسوم به «قالب صابون» یا Bar of Soapخوابیدهاست؛ نمونهای اولیه از وسیله دستی که توسط براندون تِیلور تحت راهنمایی وی مایکل باو جونیور، رئیس آزمایشگاه الکترونیک امور مشتریِ MIT ساخته شدهاست. تِیلور از بخش رسانههای آزمایشگاه مؤسسه فناوری ماساچوست (MIT) فارغالتحصیل خواهدشد.
قالب صابون، نمونهای از چیزی است که مایکل باو آن رادستگرفتنی (Graspable) مینامد. او توضیح میدهد. «اشیائی که میتوانند در دست گرفته شوند مثل یک فرمان، چوب بیسبال یا هر چیز دیگر و از اینکه شما چگونه آنها را در دست گرفتهاید، آگاهند.» او زمانی را پیشبینی میکند که اشیایی اطراف ما را فرا بگیرند که نسبت به چگونگی استفاده خودشان آگاهی دارند.
به عنوان مثال، شیئی را تصور کنید که در دست گرفتهاید. آن شیء با تشخیص یک موقعیت وخیم پزشکی، عکسالعمل درستی برای جبران آن موقعیت از خود نشان میدهد یا هنگامی که شما لیوان خود را برمیدارید، آواتار شما در Second Life نیز لیوانی برمیدارد.
تیلور،Bar of Soap اولیه را یک «دستگاه چندمنظوره حساسبهموقعیت» مینامد. درون نمونه اولیه آزمایشی، یک سرعتسنج چگونگی حرکت دستگاه را میسنجد. روی سطح خارجی دستگاه نیز یک صفحه لمسی وجود دارد که بهوسیله 72 سنسور خازنی پوشانده شدهاست و دستانی را که لمسش میکنند، تشخیص میدهد.
تیلور توضیح میدهد: «ما به کاربران یاد دادیم که به شکلهای مختلف آنرا در دست بگیرند و موقعیت آنرا در حالتهای مختلف استفاده مشاهده کردیم.»
طبیعتاً همه افراد یک وسیله را به یک شکل در دست نمیگیرند، حتی یک تلفن همراه را. قالب صابون چگونگی استفاده خود را ثبت میکند تا مشخص کند یک «جمعیت» چگونه یک وسیله را در حالت تلفن همراه یا دوربین دیجیتال یا کنسول بازی در دست میگیرد. این وسیله میتواند، تشخیص دهد که بهعنوان تلفن همراه استفاده میشود یا بهعنوان یک کنترل از راه دور (عملکرد دیگری که در کنار PDA و بازی در Bar of Soap پیشبینی شدهاست).
مایکل باو فکر میکند، در حقیقت این برای یک وسیله ارزانقیمت، الگوشناسی پیچیدهای است.
واضح است که شما دوست دارید چنین وسیلهای، با روش خاصی که شما آنرا در دست میگیرید سازگار باشد. برای وجود چنین امکانی، باید مجموعهای غنی از دادههای مربوط به انواع روش استفاده را در دستگاه گنجاند. تیلور توضیح میدهد: «ما میخواهیم ببینیم مردم چگونه وسیلههای مختلف را در دست میگیرند و هر وسیله چگونه میان افراد متفاوت میچرخد.
بیشتر مردم دوست ندارند که کار اضافهای برای تغییر کارایی انجام دهند. با استفاده از این وسیله، شما مجبور نیستید به منوی دوربین بروید، خود دستگاه میداند که شما این را میخواهید یا قصد دارید با استفاده از آن تماسی بگیرید. دیگر مجبور به انجام هیچ کار اضافهای نیستید.»
تیلور با تکمیل پایاننامهاش با موضوع دستگرفتنیها و تشخیص الگوی مورد استفاده، فارغالتحصیل خواهدشد. او فکر میکند که قالب صابون فقط نخستین گام خواهدبود. چنانکه خودش میگوید: «جهش بعدی ورود دستگرفتنیها به ابعادی متفاوت خواهدبود؛ نهفقط بهعنوان یک وسیله دستی چندمنظوره.»
امآیتی نمونه اولیه دستگرفتنی را به حمایتکنندههای زیادی نشان داده، اما هنوز هیچ محصول خاصی پیشبینی نشدهاست. موضوعی که درباره نمونه اولیه قالب صابون وجود دارد، این است که فناوری جدید یا ویژهای را بهکار نمیگیرد، فقط هوش مصنوعی خاصی است که آنرا قابل استفاده میکند. مایکل باو میگوید: «الگوریتمها و اجزای مورد نیاز موجود هستند. برای ساخت آن به چیز عجیب و غریب و یافتنشدنی نیازی ندارید؛ بنابراین ورود آن را به بازار نزدیک میبینم.»
سیستمهای بینایی کامپیوتری
دانشگاه کارنگی ملون
شاید روزی آن صفحه دکوری کنار فرمان خودروی شما، چیزی بیش از سرعت و مسافت را بهشما نشان دهد؛ به عنوان مثال، چیزی که در مه مخفی شدهاست.
زمانی قبل از ورود اکسباکس 360 و سیستمهای چهارهستهای، اضافه کردن جلوههای مهمانند به بازیها، کاری غیرممکن بهنظر میرسید. اما امروز در زندگی واقعی، مشکل برداشتن این نوع افکتها است؛ تصور کنید، در یک جاده مهآلود یا بارانی بهراحتی رانندگی میکنید.
البته، ما درباره اصلاح آب و هوا صحبت نمیکنیم. سرینیواسا ناراسیمهان، استادیار دانشگاه کارنگیملون در رشته بینایی کامپیوتری، میگوید: «شما در واقع خودِ مه را از بین نمیبرید؛ بلکه مه را از داخل تصاویر حذف میکنید. در حقیقت این دو مشکل (اضافه کردن مه به تصاویر کامپیوتری و حذف مه از تصاویر واقعی) از پیچیدگی یکسانی برخوردار نیستند.»
البته، اضافه کردن مه بهمراتب آسانتر است؛ اما باو در حال حاضر تصاویر مهآلود و ناواضح را میگیرد و به آنها شفافیت میبخشد.
کلید اصلی کنترل روشنایی است. ناراسیمهان میگوید: «یک صحنه مهآلود را با نور سیال روشن کنید. این بدترین کاری است که میتوانید انجام دهید، زیرا آن نور منعکس میشود و تمام کنتراست موجود را از بین میبرد.»
مه و آب از نقطهنظر بصری، محیطهای توزیعی محسوب میشوند. وی توضیح میدهد، باید به پویش نور موجود در سراسر صحنه پرداخت. سپس میتوان نتایج را برای تهیه یک تصویر شفاف به یک دوربین داد.
هنگام رانندگی، شما هرگز نمیتوانید با نوربالا به عمق یک مه بروید؛ نور فقط مه را پر میکند و باعث مبهم شدن همه چیز میشود. بههمین دلیل است که نورهای مخصوص مه معمولاً کمنور و نزدیک به جاده هستند؛ جایی زیر سطح مه.
مجله نیچر یک دهه پیش در گزارشی اعلام کرد، رانندگان در مه عموماً سریعتر از حد معمول میرانند، زیرا، عدم وجود محدوده دید دقیق، باعث میشود که حرکات خود را کندتر از آنچه است، احساس کنند. ناراسیمهان سیستمهای نقل و انتقال هوشمند را در حوزههایی بهغیر از خودرو (که تمرکز اصلی روی آن بوده) توسعه دادهاست.
کاوش و امنیت در میان سفرهای هوایی و زیر دریا ارتقا پیدا خواهندکرد و یک سیستم بینایی در قالب ابزارهای دستی برای آتشنشانها و معدنچیها (یا هر کسی که وارد محیطی میشود که بهدلیلی بهجز تاریکی، میدان دید محدودی دارد) پیشبینی میشود.
این فناوری میتواند برای فیلمسازانی که آب و هوای نامساعد مزاحم کارشان میشود، مفید باشد. در وبسایت ناراسیمهان ( www.cs.cmu.edu/~srinivas) صحنهای از فیلم فورستگامپ موجود است که باران از آن حذف شدهاست.
گروه تحت سرپرستی ناراسیمهان برای عملی ساختن این پروژه، مشغول برنامهنویسی هستند. در حال حاضر برای نورها از پروژکتور استفاده میکنند که بهراحتی میتواند با استفاده از برنامههای نوشتهشده الگوهای مختلف را نشان دهد.
در نمونههای نهایی، یک LED سفارشی و اختصاصی میتواند سادهترین نور برای انجام این کار باشد؛ اما لیزر نیز بهخوبی از عهده انجام این کار بر میآید.
یکی از شاخههای فرعی تحقیقات ناراسیمهان، بازسازی صحنه است. نورهای پویشگر، بهجای آنکه فقط یک دید کلی از آنچه پیش رو است، فراهم کنند میتوانند یک نمونه کامل سهبعدی را از آنچه قابل دیدن نیست، ثبت کنند.
ایده دیگر آن است که این دوربین بهعنوان یک وسیله سنجش آب و هوا مورد استفاده قرار گیرد. به همان شکلی که یک نفر با دیدن هاله دور یک چراغ در باران میفهمد که باران میبارد؛ یک سیستم بصری میتواند بلافاصله میزان رطوبت هوا را تشخیص دهد.
چنانکه ناراسیمهان میگوید: «در حال حاضر محدودیت اصلی آنها در راه عرضه محصول فناوری نیست، بلکه بازاریابی محصول محدودیت اصلی است. بهعنوان مثال، چراغهای خودرویی که با استفاده از سیستم نقل و انتقال هوشمند کار میکنند شاید تا پنج سال دیگر آماده عرضه شوند، اما این به آن معنا نیست که شرکتهای خودروسازی که خودشان چراغهای مخصوص مه را برای فروش دارند، به آن روی میآورند.»
ناراسیمهان در ادامه میگوید، «چراغهای مخصوص مه فقط از لحاظ روانی به راننده کمک میکنند، اما آنها در واقع ایمن نیستند.» حداقل با حمایتکنندههایی مانند بنیاد علمی ملی، او خیالش راحت است که تحقیقاتش تا رسیدن به آینده قابل پیشبینی، ادامه خواهدداشت.
شنوایی ماشینی
اگر با برنامههای شناسایی گفتار کار کرده باشید، حتماً میدانید که در محیطهای پرسر وصدا بهخوبی کار نمیکنند. اما همان مطلب را در همان محیط پرسروصدا به یک انسان بگویید، بهخوبی خواهدفهمید که چه میگویید. صداهای متغیر یا خیلی آهسته، بهراحتی برای انسان قابلدرک هستند. اما برای یک کامپیوتر چنین نیست.
دیوید اندرسون، استادیار رشته پردازش سیگنال دیجیتالی و مهندسی کامپیوتر در مؤسسه فناوری جورجیا میگوید: «من فکر میکنم برای تقلید عملکرد انسان در این حوزه، به قدرت محاسباتی بیشتری نیاز داریم.» بههر حال گوش کردن، بیش از شنیدن به قدرت نیاز دارد.
اندرسون با همکاری پل هِیسلر، کار روی «شنوایی ماشینی» را با ورودی صدای آنالوگ و با استفاده از پردازندههای فوقالعاده کمتوان تجربه کردهاست. گروه موفق شدهاست با استفاده از تنها پنج تا سی میکرووات توان مصرفی، به تجزیه و تحلیل محدودهای از صداهای مختلف بپردازد.
از جمله صدای انسان. با وجود اینکه این فناوری به انعطافپذیری گوش انسان نیست، اما آن قدر پیشرفت کرده که بتواند میان صدای انسان و صداهای پسزمینه تمایز قائل شود. بهخاطر آنکه ورودی از توان مصرفی بسیار پایینی برخوردار است، اندرسون فکر میکند، چنین سنسوری میتواند با استفاده از یک باتری AA یک تا دو سال کارکند و حتی میتواند با استفاده از یک سلول خورشیدی کوچک، بهطور مداوم فعال باشد.
اندرسون و گروهش با استفاده از آرایههای آنالوگ برنامهپذیر (FPAA)، نمونههای اولیهای از پردازندههای سیگنال دیجیتالی ساختهاند که با ورودی آنالوگ کار میکنند. اندرسون در این رابطه میگوید: «دیجیتال قابل پیشبینی است و برنامهنویسیاش نیز راحت است. اما برای پردازش آن باید بهای آنرا، یعنی توان مصرفی بیشتر را بپردازی.»
تجهیزات شنواییِ کاوشگر، کارکردی بیش از میکروفون دارند و یک تراشه شنوایی ماشینی میتواند به صداهای خاصی حساس باشد؛ مانند شکستهشدن شیشه، تیراندازی یا زمزمه افراد مختلف. همه صداهای مذکور تفکیکپذیر هستند و بهمحض آنکه صدای تعیینشده شنیدهشود، تراشه برای برنامه امنیتی اخطار میفرستد.
یک تراشه حذفکننده نویز، با توانایی تفکیک صدای پسزمینه از صدای اصلی، صداهای اضافی را فیلتر میکند. اندرسون میگوید: «این روش در حذف صداهای اضافی بدون تحت تأثیر قرار دادن صدای مکالمه بسیار مؤثر بود.» البته، شناسایی و درک آنچه که گفته شده به این مرحله و این تراشه ارتباطی ندارد.
در حقیقت، شنوایی ماشینی را نمیتوان با تشخیص صدای انسان توسط کامپیوتر یکی کرد، اما این دو مانند دو قطعه یک پازل به یکدیگر میپیوندند. در حال حاضر، تجزیه و تحلیل همهجانبه سیگنالهای صدای انسان که بهوسیله کامپیوتر دریافت میشود ، بهصورت بیدرنگ کار مشکلی است.
بیشتر این تجزیه و تحلیلها بهوسیله یک کامپیوتر شخصی انجام میشوند، اما گاهی ساعتها طول میکشد تا نتیجه مورد نظر بهدست آید. اندرسون معتقد است، راه بهتری هم وجود دارد؛ «ما همیشه سعی میکنیم از مغز تقلید کنیم.» گروه هر چه بیشتر سعی میکند عملکرد سلولهای خاکستری را در این حوزه شبیهسازی کند، بیشتر موفق میشود. اندرسون تلاشهای گروهش را در این زمینه، به تلاشهای هنرآموزی تشبیه میکند که با کپی از روی کار بزرگان، تکنیکهای استفادهشده را بیشتر میفهمد و یاد میگیرد.
حتی اگر سیگنال یا صدا تا حدی مبهم باشد باز هم مغز میتواند مفهوم کلی عبارت یا کلمه را متوجه شود، زیرا مغز فقط از یک روش برای درک آنچه اتفاق میافتد، استفاده نمیکند. بهکارگیریِ یک برنامه سنتی شناخت گفتار برای استفاده از ویژگیها و روشهای چندگانه تجزیه و تحلیل، با سختافزار و نرمافزار امروزی، اگر نگوییم غیرممکن، بسیار مشکل است.
بنابراین، هدف اصلی همچنان این است که کامپیوتر صدا را با استفاده از همان روش مغز انسان تجزیه و تحلیل کند. آموزش سیستمی که نمونههای کافی دارد، برای انجام آن نوع شناسایی، میتواند هزاران یا میلیونها ساعت زمان ببرد.
اندرسون امیدوار است که تکنیکهایی مشابهِ همانهایی که در بهبود تصاویر کامپیوتری مورد استفاده قرار میگیرند، در این زمینه کمککننده باشند و با کمک این تکنیکها بتوان با استفاده از بخشهای کوچک و شناختهشده یک سیگنال و ترکیب آنها، دقت شنوایی کامپیوتر را تا حد بسیار زیادی افزایش داد.
در حالیکه بعضی برنامههای شنوایی ماشینی در حال حاضر موجود و مورد استفاده هستند، برنامههای هوشمند و پیشرفتهتر هنوز چند سالی تا عرضه فاصله دارند. قبل از آنکه ماشین بتواند زبان ما را بفهمد، باید بتواند صدای ما را بهخوبی بشنود.
|