تشخیص اخبار جعلی منتشر شده در شبکۀ اجتماعی اینستاگرام بر اساس تارنمای خبری ایسنا مبتنی بر الگوریتم متن‌کاوی و معنی‌شناسی در زبان‌فارسی

دستلان, مرتضی; ده بزرگی, مهشید; مریدی, بهزاد; امامی, محسن

doi:10.30473/il.2022.57037.1429

- فلوچارت مراحل ورود و ثبت نام در سامانه نشریات علمی وزارت عتف

- راه اندازی سیستم مدیریت نشریات علمی دانشگاه پیام نور

تعداد نشریات	49
تعداد شماره‌ها	1,269
تعداد مقالات	10,975
تعداد مشاهده مقاله	22,501,004
تعداد دریافت فایل اصل مقاله	15,171,769

	تشخیص اخبار جعلی منتشر شده در شبکۀ اجتماعی اینستاگرام بر اساس تارنمای خبری ایسنا مبتنی بر الگوریتم متن‌کاوی و معنی‌شناسی در زبان‌فارسی
فصلنامه علمی - پژوهشی زبان‌شناسی اجتماعی
مقاله 7، دوره 4، شماره 3 - شماره پیاپی 15، تیر 1400، صفحه 91-104 اصل مقاله (1.16 M)
نوع مقاله: مقاله پژوهشی
شناسه دیجیتال (DOI): 10.30473/il.2022.57037.1429
نویسندگان
مرتضی دستلان^* ¹؛ مهشید ده بزرگی²؛ بهزاد مریدی¹؛ محسن امامی³
¹استادیار زبان‌شناسی همگانی، دانشگاه پیام نور، تهران، ایران
²کارشناسی ارشد زبان‌شناسی همگانی، دانشگاه پیام نور، تهران، ایران
³استادیار مهندسی کامپیوتر، دانشگاه پیام نور، تهران، ایران
چکیده
اخبار جعلی ورزشی که در شبکه‌های اجتماعی پخش می‌شوند برای ورزشکاران، باشگاه‌های ورزشی، ورزش دوستان و ... ناخوشایند هستند، پس تشخیص اخبار جعلی و غیرجعلی امری مهم و کاربردی است. این پژوهش، در چارچوب زبان‌شناسی رایانه‌ای انجام‌گرفته است. پیکره‌ی زبانی این تحقیق بر اساس بارگیری اخبار ورزشی از تارنمای ایسنا و برنامۀ اینستاگرام بوده است؛ بدین صورت که اخبار ورزشی از تارنمای ایسنا در یک محدودۀ زمانی بارگیری شده است و سپس در چند صفحه برنامۀ اینستاگرام، اخبار ورزشی بارگیری شده و از لحاظ جعلی بودن یا غیرجعلی بودن با هم مقایسه شده‌اند. برای شناسایی اخبار جعلی از غیرجعلی از روش ان-گرم و روش حافظه طولانی کوتاه-مدت (ال اس تی ام) استفاده شده است. روش پیشنهاد شده در این مقاله روی چهار دیتاست معتبر و موجود پیاده سازی شده و با شش روش پیشین مقایسه شده است. دقت این روش نسبت به دیگر روش‌ها قابل قبول می‌باشد و نتایج به دست آمده، بیانگر این است که برای شناسایی اخبار جعلی، در میان خبرهای منتشر شده در اینستاگرام، این روش، مناسب می‌باشد و دقت کافی را دارد.
کلیدواژه‌ها
اخبار جعلی؛ زبان‌شناسی رایانه‌ای؛ ان-گرم؛ ال اس تی ام؛ الگوریتم متن کاوی؛ زبان فارسی؛ زبان‌شناسی اجتماعی
عنوان مقاله [English]
Detection of Fake Sport News Published in Instagram Social Network based on ISNA News Website: A Study on the Basis of Mining Algorithm in Persian Language
نویسندگان [English]
Morteza Dastlan¹؛ Mahshid Dehbozorgi²؛ Behzad Moridi¹؛ Mohsen Emami³
¹Assistant Professor of General Linguistics, Payame Noor University, Tehran, Iran
²M.A. in General Linguistics, Payame Noor University, Tehran, Iran
³Assistant Professor of Computer Engineering, Payame Noor University, Tehran, Iran
چکیده [English]
The distribution of fake sport news is not based on the satisfaction of sport men, sport clubs and sport fans. Correspondingly, the identification of fake news is important and practical. This research has been done in the framework of computational linguistics. The linguistic data are based on a corpus of sports news from ISNA website and Instagram program. In this way, sports news is downloaded from the ISNA website in a period of time, and then in a few pages of the Instagram program, sports news is downloaded and compared in terms of being fake or not. The N-gram method and long and short term memory (LSTM) method have been used to identify fake news from non-fake ones. The method proposed in this paper has been implemented on four valid and existing datasets and has been compared with the previous six methods. The accuracy of this method is acceptable compared to other methods, and the results obtained indicate that this method is suitable and accurate enough to identify fake news among the news published on Instagram.
کلیدواژه‌ها [English]
fake news, computational linguistics, N-gram, LSTM, mining algorithm, Persian language

مراجع
امیری، علی، عادل آذر و میثم شهبازی. (1399). ارائه رویکردی مبتنی بر برنامه ریزی تصادفی و زنجیره مارکوف به منظور بهینه سازی بازتولید و برون سپاری در زنجیره تامین. مطالعات مدیریت صنعتی. 18 (57). 1-42. تاجیک اسماعیلی، سمیه، ابوالفضل علیپور و سروناز تربتی. (1399). نقش اینستاگرام در توسعه برند شخصی (مورد مطالعه: کاربران اینترنتی اینستاگرام، 1398). پژوهش‌های ارتباطی. 27(3). 35-57. http://ensani.ir/file/download/article/1614585842-9616-103-2.pdf ذاکری، مرتضی. (1396). مشخص کردن برچسب اجزای سخن. https://elmnet.ir/Article/11185539-25131/%D8%A8%D8%B1%DA%86%D8%B3%D8%A8-%D8%B2%D9%86%DB%8C-%D8%A7%D8%AC%D8%B2%D8%A7%DB%8C-%D8%B3%D8%AE%D9%86-%D8%AF%D8%B1-%D9%86%D9%88%D8%B4%D8%AA%D9%87-%D9%87%D8%A7%DB%8C- %D9%81%D8%A7%D8%B1%D8%B3%DB%8C-%D8%A8%D8%A7-%D8%A7%D8%B3%D8%AA%D9%81%D8%A7%D8%AF%D9%87-%D8%A7%D8%B2-%D8%B4%D8%A8%DA%A9%D9%87-%D9%87%D8%A7%DB%8C-%D8%B9%D8%B5%D8%A8%DB%8C-%D9%88-%D8%A8%D8%A7%D8%B2%D9%86%D9%85%D8%A7%DB%8C%DB%8C-%DA%A9%D9%84%D9%85%D8%A7%D8%AA سالاری، سیدمجتبی، و فضل الله ادیب‌نیا. (1389). 10 الگوریتم از برترین‌های داده کاوی. سیزدهمین کنفرانس دانشجویی مهندسی برق ایران تربیت مدرس. 24-26. سامانی، سمانه، و اعظم فراهانی. (1395). هویت آنلاین و اینستاگرام (مطالعه چگونگی نمایش هویت جوانان در اینستاگرام). رسانه. 27(2). 85-104. http://ensani.ir/file/download/article/20170201142336-9616-399.pdf صفوی, کورش. (1382). پژوهش درباره با هم‌آیی واژگان در زبان فارسی. متن پژوهی ادبی. 7(18)، 1-13. لاینز، جان. (1391). درآمدی بر معنی‌شناسی زبان، ترجمة کورش صفوی، تهران: علمی. نیکوگفتار، هانیه، عباس بحرودی، بهزاد تخم‌چی، غلامحسین نوروزی، بهزاد مهرگینی. (1392). مدل‌سازی با زنجیره مارکوف، مطالعه موردی: رخساره‌های سنگی یکی از مخازن نفتی جنوب باختر ایران‌. فصلنامه علمی-پژوهشی علوم زمین. 9، (1). 65-77.‎ https://iranjournals.nlai.ir/bitstream/handle/123456789/90400/4CF4E2C9954C0BDCED92BA969E000F4F.pdf?sequence=-1&isAllowed=y Amirkhani, H., Jafari, M. A., Amirak, A., Pourjafari, Z., Jahromi, S. F., & Kouhkan, Z. (2020). Farstail: A Persian natural language inference dataset. arXiv preprint arXiv:2009.08820. Chaffey, D. (2021). Global social media research summary 2016. Smart Insights: Social Media Marketing. https://www.smartinsights.com/social-media-marketing/social-media-strategy/new-global-social-media-research/ De Beer, D., & Matthee, M. (2020). Approaches to identify fake news: A systematic literature review. In International Conference on Integrated Science (pp. 13-22). Springer, Cham. De Oliveira, N. R., Medeiros, D. S., & Mattos, D. M. (2020). A sensitive stylistic approach to identify fake news on social networking. IEEE Signal Processing Letters, 27, 1250-1254. Gahirwal, M., Moghe, S., Kulkarni, T., Khakhar, D., & Bhatia, J. (2018). Fake news detection. International Journal of Advance Research, Ideas and Innovations in Technology, 4(1), 817-819. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. Book in preparation for MIT Press. URL¡ http://www. deeplearningbook. org, 1. Jimenez, M., Maxime, C., Le Traon, Y., & Papadakis, M. (2018). On the impact of tokenizer and parameters on n-gram based code analysis. In 2018 IEEE International Conference on Software Maintenance and Evolution (ICSME) (pp. 437-448). https://orbilu.uni.lu/bitstream/10993/36135/1/icsme3.pdf Mertoğlu, U., & Genç, B. (2020). Automated fake news detection in the age of digital libraries. Information Technology and Libraries, 39(4). https://doi.org/10.6017/ital.v39i4.12483 Minyoung Huh, Andrew Liu, Andrew Owens, Alexei A. (2018). Fighting fake news: Image splice detection via learned self-consistency. Efros; Proceedings of the European Conference on Computer Vision (ECCV), pp. 101-117. Veisi, H., & Sameti, H. (2013). Speech enhancement using hidden Markov models in Mel-frequency domain. Speech Communication, 55(2), 205-220.
آمار تعداد مشاهده مقاله: 1,484 تعداد دریافت فایل اصل مقاله: 747

سامانه مدیریت نشریات علمی. قدرت گرفته از سیناوب

پیوندهای مفید

اخبار و اعلانات

آمار

تشخیص اخبار جعلی منتشر شده در شبکۀ اجتماعی اینستاگرام بر اساس تارنمای خبری ایسنا مبتنی بر الگوریتم متن‌کاوی و معنی‌شناسی در زبان‌فارسی