7 مقاله جدید در رابطه با متن کاوی

RSS

عضو شوید

:: فراموشی رمز عبور؟

عضویت سریع

به وبلاگ من خوش آمدید

براي اطلاع از آپيدت شدن وبلاگ در خبرنامه وبلاگ عضو شويد تا جديدترين مطالب به ايميل شما ارسال شود

آمار مطالب

:: کل مطالب : 63401
:: کل نظرات : 0

آمار کاربران

:: افراد آنلاین : 1
:: تعداد اعضا : 55

کاربران آنلاین

آمار بازدید

:: بازدید امروز : 4511
:: باردید دیروز : 41966
:: بازدید هفته : 47081
:: بازدید ماه : 387068
:: بازدید سال : 4271485
:: بازدید کلی : 8608511

7 مقاله جدید در رابطه با متن کاوی

نوشته شده توسط : زپو

کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر و مخابرات (19 نوابر 2017)

بررسی انواع منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی:

چکیده :

دانش مهمترین بخش ابهام زدایی مفهوم کلمات است. این دانشها میتوانند در شکل های گوناگون و به صورت یک مجموعه از متون باشند که در آن مفهوم کلمه برچسب گزاری شده است. پایگاه دانش یک مجموعه از متن، برچسب ها و توضیحات در جهت تشخیص مفهوم کلمه است. مانند فرهنگ لغت قابل خواندن توسط ماشین، شبکه معنایی، اصطالحنامه و آنتولوژی. تقریبا از تمام این منابع در ابهام زدایی مفهوم کلمات استفاده میشود. کلیه منابع به دو دسته منابع دارای ساختار و منابع بدون ساختار تقسیم میشوند. جمله ورودی، یک متن بدون ساختار از اطالعات است. برای کسب مفهوم صحیح کلمات باید بر روی آن پیش پردازشهایی انجام شود تا بتوانیم بستری را فراهم نماییم که بتوان بهترین مفهوم را بدست آورد. در این مقاله، منابع دارای ساختار و منابع بدون ساختار و پیش پردازش های ابهام زدایی مفهوم کلمات در پردازش زبان طبیعی را مورد بررسی قرار می دهیم که بر اساس بررسی های انجام شده، استفاده از وردنت پیشنهاد می شود که یک منبع ضروری برای ابهام زدایی مفهوم کلمات است و یک منبع دارای ساختار می باشد.

کلمات کلیدی: اصطالحنامه، فرهنگ لغتهای قابل خواندن توسط ماشین، آنتولوژی، وردنت، Corpora

مروری بر روشهای خالصه سازی خودکار متون:

چکیده :

امروزه پردازش زبان طبیعی در زمینه های گوناگون نظیر خالصهسازهای خودکار و مترجمهای 1 ماشینی ، توجه زیادی را به خود جلب نمودهاند. در زبان فارسی هم مانند سایر زبانهای دیگر دنیا تالشهایی در زمینه ساخت ابزارهای خالصه سازی صورت گرفته است. تمرکز محققان بر ارایه روشهایی متمرکز است که بتواند خالصه هایی پر محتوا، سلیس و روان نسبت به روشهای خالصه سازی پیشین ارایه دهند . خالصه سازی یک مهارت نگارشی به شمار می رود، که هدف از ایجاد سیستم خالصه ساز اتوماتیک تقلید کلیه مراحلی است که توسط عامل انسانی انجام می شود، بدین صورت کهمتن به طور کامل خواندهوفهمیده شودوبا تشخیصوتفکیک قسمت های مهم وغیرمهم متن، نسخه خالصه شده متن اصلی تولید گردد. هدف از خالصه سازی خودکار سند، تولید یک نسخه مختصرتر از سند اصلی توسط یک برنامه رایانهای بهنحویکهویژگیهاونکاتاصلی سند اولیه حفظشود.بنابرتعریفارائه شدهدراستاندارد 212 ISO ،خالصه "یک بازگویی مختصر از سند" می باشد. روش های تولید خالصه را با توجه به انواع دیدگاه های مختلف خالصه سازی می توان به چندین دسته تقسیم بندی نمود، به عنوان مثال روش تولید خالصه تک سندی و چند سندی، تک زبانه و چند زبانه، مبتنی بر تعامل با کاربر و غیر مبتنی بر تعامل با کاربر و... لیکن با توجه به اهمیت فاکتور خروجی در تولید خالصه در این مقاله به بررسی روش های تولید خالصه گزینشی)استخراجی( و چکیده ای)مفهومی( پرداخته می شود.

واژگان كلیدي:پردازش زبان طبیعی، خالصهسازهای ماشینی، روابط کالمی ، تشابه معنایی، شبکه واژگان

ارزیابی سیستماتیک متون دانشجویان در کلاس های مجازی آنالین

چکیده :

عدم تعامالت و ارتباطات مستقیم اساتید و دانشجویان منجر به عدم تمرکز ایشان در کالس های مجازی می شود . از آنجا که ارزیابی همواره ابزار مناسبی برای ایجاد تمرکز و مشارکت دانشجویان بوده است منطقی است که به دنبال ابزاری جهت برآورد میزان مشارکت دانشجویان در کالس های آنالین باشیم . در این مقاله سعی داریم با استفاده از روش های متن کاوی ، پردازش زبان طبیعی و ترجمه ماشینی به الگوریتمی جهت ارزیابی متون وارد شده از سوی دانشجویان و تخصیص امتیاز به هر متن دست یابیم و بتوانیم پس از پایان کالس با محاسبه ، ثبت و اعالم برآورد امتیازات هر دانشجو به یک ارزیابی از میزان مشارکت مفید دانشجو در کالس های آنالین دست یابیم . واژههای کلیدی متن کاوی ، پردازش زبان طبیعی ، ترجمه ماشینی ، پایگاه داده ها

ایجاد و انتشار زیر ساخت وب معنایی براي قرآن کریم

چکیده شده است. تبدیل شناسی کامپیوتر و زبان حوزهو پژوهشگران محققان اساسی هاي یکی از دغدغهبه هاي اخیر در سال ايرایانهشناسی زبان یبا سرعت و دقت قابل توجه متن راپردازش که بتوان بسیاري از کارهاي مرتبط با ستا و ابزارهاي هوشمند باعث شده رایانهاستفاده از هاي پیکره پردازد. زبان می هايابزاري براي بیان ویژگیبه عنوان ی متن يهایکرهدر حوزه متن به پردازش پ یعیانجام داد. پردازش زبان طب واعد و ساز و کار زبان پی توان با تحلیل آنها به استخراج اجزا، قمتنی در واقع نمادي از زبان هستند که با هدف خاصی تولید گردیده، می ینا يمحتوا يرا در ارائه یمناسب یپژوهش یط، محيایانهرا هاييفناور یريمتون و با بکارگ يسازیو غن يفرآور بادر مرحله بعد، برد و .نمود یجادکارآمد ا يامتون به گونه ي و زیرساختی که تحت عنوان پیکرهپیکره متنی "فرقان" اي هوشـمند گیـري از سـامانه حاصـل بهـره د گردیده، تولیقرآن کریم براي ي اطلاعات قرآنی، آماري، متن و ترجمـه فارسـی و انگلیسـی آیـات و برچسـب کلیهحاوي مگابایت داده، 587 .این پیکره با بیش از است - و بسـیاري مـوارد دیگـر در قالـب ایابی کلمات آنهمتن عربی، فارسی و انگلیسی آیات، ریشهصرفی و نحوي گذاري RDF امکـان و سـت ا .استفاده و کاوش را براي هرگونه پژوهش و پردازش هوشمند ایجاد کرده است کلید واژه پردازش زبان طبیعی، پیکره، وب معنایی، قرآن کریم، RDF.

نگرشی جدید به تحلیل عبارت هاي اسمی هم مرجع

چکیده:

پردازش زبان طبیعی شامل وظایفی همچون استخراج اطلاعات، خلاصه سازي متن، پرسش و پاسخ می باشد که همگی نیاز دارند تا تمام اطلاعاتی که در مورد یک موجودیت در متن وجود دارد را شناسایی نمایند. بنابراین وجود سیستمی که بتواند موضوع تحلیل عبارت هاي اسمی هم مرجع را بررسی نماید، کمک شایانی به انجام موفقیت آمیز این وظایف خواهد نمود. ما در این مقاله، سعی داریم تا به طور دقیق، فرآیند تحلیل مرجع مشترك را بررسی نمائیم. در همین راستا نیز فرآیند مشابه دیگري تحت عنوان تحلیل پیشایند را نیز مطالعه خواهیم نمود. امید داریم تا با بررسی این فرآیند و مقایسه ي شباهت ها و تفاوت هاي آنها، به نگرشی جدید در مورد تحلیل عبارت هاي اسمی هم مرجع برسیم.

کلمات کلیدي :پردازش زبان طبیعی، استخراج اطلاعات، تحلیل مرجع مشترك ، تحلیل پیشایند

تعیین احساس از روي متن فارسی

چکیده:

در بسیاري از کاربردهاي تبدیل متن به گفتار بهتر است تا مشخصات گفتار تولید شده هرچه بیشتر شبیه به انسان باشد. براي این کار باید متنی که توسط سیستم ادا میشود، از لحاظ معنایی بررسی شود. یکی از مهمترین این ویژگیهاي معنایی، احساس حاکم بر متن است. در زمینه تعیین احساس از روي متن، کارهاي مختلفی در زبان انگلیسی صورت گرفته است؛ اما کمتر کسی اقدام به کار بر روي پیکرههاي فارسی کرده است. در این مقاله، پیکره اي شامل 3702 جمله از 6 کلاس احساس خوشحالی، عصبانیت، خنثی، ناراحتی، تنفر و ترس تهیه شده است و روشهاي گوناگونی جهت تعیین احساس از روي یک جمله متنی به زبان فارسی به کار گرفته شده است. با بررسی نتایج بدست آمده متوجه میشویم که عملکرد برنامه در صورت استفاده از رویکرد مبتنی بر پیکره مطلوب است و داراي حداکثر دقت 85/78 %و زمان بسیار کوتاه آموزش میباشد.

واژههاي کلیدي: پردازش زبان طبیعی، مدل زبانی، تحلیل معنایی، یادگیري ماشین، Bayes Naïve Complement

برای خرید و دانلود اینجا کلیک کنید