خانه / اخبار / سامانه پیکره های ایرانداک (ساپا)

سامانه پیکره های ایرانداک (ساپا)

در پاسخ به نیاز پژوهشگران کشور در آسانسازی فرایند پژوهش، پژوهشگاه علوم و فناوری اطالعات ایران (ایرانداک)، سامانة پیکرههای ایرانداک (ساپا) را در نشانی SAPA.IRANDOC.AC.IR راه اندازی کرده و در دسترس همة پژوهشگران کشور گذارده است. بسیاری از پژوهشهای زبانشناسی و تصمیمگیریها در برنامه ریزی زبانی، تنها با کاربرد یک پیکرة زبانی شدنی هستند. پیکره؛ مجموعهای نظاممند، رایانهای، و درست از زبان است که برای بررسیهای زبانشناختی به کار میرود. پیکرهها کاربردهای بسیاری را در پردازش زبان طبیعی و درک و بازشناسی گفتار، تبدیل متن به گفتار و گفتار به متن، نگارش فرهنگها، آموزش و پژوهش، ساخت پایگاههای دادة زبانی، بررسی واژههای همآیند در زبانهای گوناگون، پایشگری زبان برای پیگیری و ردگیری دگرگونیهای زبانی، ترجمة ماشینی، توسعة مفاهیم و منابع در پیوند با واژگان، نگارش و گسترش مهارتهای نوشتاری، آموزش و یادگیری زبان با شناخت گویشها و گوناگونی زبانها، معناشناسی، تحلیل کالم، زبانشناسی اجتماعی، زبانشناسی حقوقی، واکاوی ژانرهای ادبی، و پژوهشهای دستور زبان دارند.

سامانة پیکرههای ایرانداک (ساپا) که میتواند از چندین پیکره پشتیبانی کند، اکنون دارای یک پیکره با نام »پیکرة پژوهشنامه« با نزدیک به چهار میلیون و ۷۸۰ هزار واژة تخصصی و میانرشته در زمینههایی مانند علم اطالعات و دانششناسی، فناوری اطالعات، مدیریت دانش، زبانشناسی رایانشی، اصطالحشناسی، و مانند آنهاست. این پیکره از مقالههای »پژوهشنامة پردازش و مدیریت اطالعات« ساخته شده است و برای پژوهشهایی که نیازمند بهرهگیری از پیکرههای تخصصی هستند، ارزش و کاربرد بسیاری دارد. هنگام بازیابی اطالعات در پیکرة پژوهشنامه، افزون بر نمایش واژه یا عبارت جستوجو در بافت زبان، نام مقالهای که آن واژه یا عبارت در آن به کار رفته است، موضوع مقاله، پدیدآوران مقاله، و فراوانی واژه یا عبارت جستوجو نیز نمایش داده میشوند. دادههای این پیکره دارای برچسب اجزای واژگانی کالم (POS tag) نیز هستند که در بسیاری از پردازشهای زبان به کار میروند و مقولة واژهها(مانند اسم، صفت، قید، و …) را پیدا میکنند.

درباره ی SamiFar

مطلب پیشنهادی

اگهی پذیرش دانشجوی در مقطع کارشناسی پیوسته بدون آزمون و با سوابق تحصیلی در سال ۱۴۰۰