How do we read a word?

چگونه یک کلمه را می خوانیم؟

مدتی است که در حال تحقیق  بر روی موضوعی هستم که در حوزه Typography قرار دارد. در بخشی از این فرایند باید پاسخی برای این پرسش پیدا می کردم که " چطور انسان نوشته ها را می خواند؟ ". این سوال زمینه تحقیقاتی مشترکی بین علوم روان شناسی، زبان شناسی و عصب شناسی بوجود آورده است. حدود 130 سال است که تحقیقات برای پاسخ گویی به این سوال جدی تر و فعال تر شده است.

شاید اینکه شما چطور این نوشته را می خوانید در ابتدا سوال بی اهمیت باشد، اما پاسخ به آن می تواند چشم اندازهای وسیعی را در برابر علوم مختلف باز کند. همین امر باعث شده تحقیقات مفصل و دامنه داری در این باره صورت بگیرد. برای مثال مایکروسافت در پروژه ClearType توجه ویژه ای به این بحث داشت و از متخصصان این حوزه در اجرای پروژه کمک گرفت.
عموما محققان، چگونه خواندن را به دو زیر مسئله تقسیم می کنند: نخست چگونگی خواندن کلمات به تنهایی، مثلا لیستی از کلمات غیر مرتبط (مستقل از متن)،  و دوم چگونگی خواندن کلمات در یک متن، که کلمات با هم ارتباط دارند (وابسته به متن).
در مورد اول سه فرضیه مهم عبارتند از:
1- فرضیه تشخیص مبتنی بر شکل
2- فرضیه تشخیص سریالی
3- فرضیه تشخیص موازی
برای قبول و رد هر یک از این سه فرضیه آزمایش هایی طراحی شده است و هر یک تنها قادر به توجیه برخی مشاهدات هستند. هر چند فرضیه سوم مشاهدات بیشتری را توجیه می کند.
اما در مورد مسئله دوم، با پیچیدگی بیشتری رو به رو هستیم و در نتیجه فرضیه ها و مدل های پیچیده تری نیز ارائه شده اند. روش هایی چون Bayesian Reader Model از جمله این مدل ها می باشد.
البته با وجود این تفکیک، در اغلب موارد مدل های ارائه شده برای حل هر کدام از این دو مسئله برای قابلیت پاسخ گویی درباره مسئله دیگر نیز مورد بررسی قرار می گیرند و گاهی نیز نتایج جالبی را نشان می دهند. در کل این دو زیر مسئله آنقدر در هم آمیخته می شوند که این تفکیک تنها در ابتدا امر ممکن است و با ورود به حیطه آزمایش و مدل سازی به سرعت مرز بین آنها ناپدید می شود.

فرضیه تشخیص مبتنی بر شکل
این فرضیه به طور خلاصه می گوید که انسان از روی شکل کلمات آنها را تشخیص میدهد. فراز و فرود، خطوط عمودی، افقی، مورب، فشردگی و ... هستند که ما را در خواند یک کلمه یاری می دهند. این ایده طی یک آزمایشی مورد بررسی قرار گرفت. به افرادی یک متن داده شده بود و از آنها خواسته شده بود تعداد غلط های املایی متن را پیدا کنند. غلط های موجود درمتن دو نوع بود. یکی غلطهایی که از نظر ظاهری شبیه کلمه اصلی بود؛ مانند: Type و Typc و نوع دوم که کلمه غلط و صحیح شباهتی نداشتند؛ مانند: Type و Gype. افراد تعداد بیشتری از غلطهای نوع دوم را پیدا می کردند!

فرضیه تشخیص سریالی
در این فرضیه اعلام می شود که برای خواند کلمات، حروف الفبا به ترتیب و پشت سر هم خوانده می شوند. آزمایشی که برای اثبات این ادعا طراحی و اجرا شد اینگونه بود که کلماتی برای مدت کوتاهی به افراد نشان داده می شد و از آنها خواسته می شد تا بگویند آیا فلان حروف الفبا در کلمه بود یا نه. اگر کلمه برای 10 ms نمایش داده می شد افراد حروفی الفبای کلمه که در جایگاه دوم به بعد بود را به خاطر نداشتند. اگر کلمه برای 30 ms نمایش داده می شد، حروف الفبایی ظاهر شده در جایگاه 4 به بعد را به خاطر نداشتن. با تکرار آزمایش ها مشخص شد، انسان به طور متوسط به 10 ms زمان برای خواند هر حرف یک کلمه نیاز دارد.

فرضیه تشخیص موازی
این فرضیه پیچیده تر از دو فرضیه قبلی بود و بیان می کرد که برای خواندن یک کلمه پردازش های موازی انجام می شود که به نوعی تشخیص مبتنی بر شکل و تشخیص موازی را در دل خود دارد. مدل های مختلفی بر پایه این فرضیه معرفی شده اند که به نظر من Verification Model از بقیه جالب تر است. ویژگی مشترک بیشتر این مدلها این است که بر پایه شبکه های عصبی هستند و از ساز و کار آنها برای توجیه خود استفاده می کنند.
به این ترتیب پیاده سازی این مدل ها برای کامپیوتر نیز کار جالبی خواهد بود که با استفاده از شبکه های عصبی مصنوعی امکان پذیر است.
با توجه به اهمیت این فرضیه سعی می کنم در نوشته ای جداگانه به بررسی دقیق تر آن بپردازم.


برای مطالعه بیشتر: