برگزاری سخنرانی علمی به مناسبت هفته پژوهش(۱): کاربرد کلان داده در پردازش زبان طبیعی

به گزارش اداره روابط عمومی مرکز منطقه ای اطلاع رسانی علوم و فناوری و پایگاه استنادی علوم جهان اسلام، مجموعه سخنرانی های ترتیب یافته جهت ارائه به مناسبت هفته پژوهش توسط اعضای هیأت علمی رایسست و ISC از امروز چهارشنبه مورخ ۷/۹/۹۷ و به همت معاونت پژوهش و فناوری رایسست آغاز شد.

بنابراین گزارش، اولین سخنران از این مجموعه، خانم دکتر بهاره پهلوان زاده عضو گروه پژوهشی طراحی و عملیات سیستمها ارائه ای با عنوان: “کاربرد کلان داده در پردازش زبان طبیعی: پردازش متون سیستم های نظرکاوی با تکیه بر تکنولوژی کلان داده ها” داشت.

کلان داده یا طبق مصوبه فرهنگستان مه داده دارایی‌های داده‌ای‌اند بسیار انبوه، پرشتاب و/یا گوناگون که نیاز به روش‌های پردازشی تازه‌ای دارند تا تصمیم‌گیری، بینش تازه و بهینگی پردازش پیشرفته را فراهم آورند.کلان داده یا بزرگ داده‌ها مسیر حرکت کسب و کار و فرایند چرخش کار در سازمان‌ها را مشخص می‌کنند. در بزرگ‌داده با داده‌های متمایز و بزرگ که دائماً از لحاظ حجم، نرخ تولید داده و تنوع در حال تغییر هستند سروکار داریم.

در اینجا، داده‌های پرشتاب داده‌هایی‌اند که با شتاب بالایی تولید می‌شوند. کلان‌داده از چند ۱۰ ترابایت به چندین پتابایت در یک مجموعه داده دارد می‌گسترد. نمونه‌هایی از کلان‌داده چنین‌اند: گزارش‌های وبی، سامانه‌های بازشناسی با موج‌های رادیویی، شبکه‌های حسگر، شبکه‌های اجتماعی، متن‌ها و سندهای اینترنتی، نمایه‌های جستجوهای اینترنتی، اخترشناسی، مدرک‌های پزشکی، بایگانی عکس، بایگانی ویدئو، پژوهش‌های زمین‌شناسی و بازرگانی در اندازه‌های بزرگ.

پردازش زبان‌های طبیعی یکی از زیرشاخه‌های بااهمیت در حوزه گسترده علوم رایانه، هوش مصنوعی، که به تعامل بین کامپیوتر و زبان‌های (طبیعی) انسانی می‌پردازد؛ بنا بر این پردازش زبان‌های طبیعی بر ارتباط انسان و رایانه، متمرکز است. پس چالش اصلی و عمده در این زمینه درک زبان طبیعی و ماشینی کردن فرایند درک و برداشت مفاهیم بیان‌شده با یک زبان طبیعیِ انسانی است. به تعریف دقیق‌تر، پردازش زبان‌های طبیعی عبارت است از استفاده از رایانه برای پردازش زبان گفتاری و زبان نوشتاری. بدین معنی که رایانه‌ها را قادر سازیم که گفتار یا نوشتار تولید شده در قالب و ساختار یک زبان طبیعی را تحلیل و درک نموده یا آن را تولید نمایند. در این صورت، با استفاده از آن می‌توان به ترجمه زبان‌ها پرداخت، از صفحات وب و بانک‌های اطلاعاتیِ نوشتاری جهت پاسخ دادن به پرسش‌ها استفاده کرد، یا با دستگاه‌ها، مثلاً برای مشورت گرفتن به گفت‌وگو پرداخت.

هدف اصلی در پردازش زبان طبیعی، ایجاد تئوری‌هایی محاسباتی از زبان، با استفاده از الگوریتم‌ها و ساختارهای داده‌ای موجود در علوم رایانه است. بدیهی است که در راستای تحقق این هدف، نیاز به دانشی وسیع از زبان است و علاوه بر محققان علوم رایانه، نیاز به دانش زبان شناسان نیز در این حوزه می‌باشد. با پردازش اطلاعات زبانی می‌توان آمار مورد نیاز برای کار با زبان طبیعی را استخراج کرد. کاربردهای پردازش زبان طبیعی به دو دسته کلی قابل تقسیم است: کاربردهای نوشتاری و کاربردهای گفتاری. از کاربردهای نوشتاری آن می‌توان به استخراج اطلاعاتی خاص از یک متن، ترجمه یک متن به زبانی دیگر یا یافتن مستنداتی خاص در یک پایگاه داده نوشتاری (مثلاً یافتن کتاب‌های مرتبط به هم در یک کتابخانه) اشاره کرد. نمونه‌هایی از کاربردهای گفتاری پردازش زبان عبارتند از: سیستم‌های پرسش و پاسخ انسان با رایانه، سرویس‌های اتوماتیک ارتباط با مشتری از طریق تلفن، سیستم‌های آموزش به فراگیران یا سیستم‌های کنترلی توسط صدا. در سالهای اخیر این حوزه تحقیقاتی توجه دانشمندان را به خود جلب کرده‌است و تحقیقات قابل ملاحظه‌ای در این زمینه صورت گرفته‌است.

خانم دکتر بهاره پهلوان زاده عضو گروه پژوهشی طراحی و عملیات سیستمها در تحقیق خود سعی در آنالیز کاربرد کلان داده ها و آنالیز آنها توسط تکنولوژی کلان داده ها را داشت.

مشتاقانه منتظر دریافت نظرات شما دوستان عزیز هستیم