
تعداد نشریات | 41 |
تعداد شمارهها | 1,143 |
تعداد مقالات | 9,839 |
تعداد مشاهده مقاله | 18,120,948 |
تعداد دریافت فایل اصل مقاله | 12,660,402 |
تشخیص اخبار جعلی منتشر شده در شبکۀ اجتماعی اینستاگرام بر اساس تارنمای خبری ایسنا مبتنی بر الگوریتم متنکاوی و معنیشناسی در زبانفارسی | ||
فصلنامه علمی - پژوهشی زبانشناسی اجتماعی | ||
مقاله 7، دوره 4، شماره 3 - شماره پیاپی 15، تیر 1400، صفحه 91-104 اصل مقاله (1.16 M) | ||
نوع مقاله: مقاله پژوهشی | ||
شناسه دیجیتال (DOI): 10.30473/il.2022.57037.1429 | ||
نویسندگان | ||
مرتضی دستلان* 1؛ مهشید ده بزرگی2؛ بهزاد مریدی1؛ محسن امامی3 | ||
1استادیار زبانشناسی همگانی، دانشگاه پیام نور، تهران، ایران | ||
2کارشناسی ارشد زبانشناسی همگانی، دانشگاه پیام نور، تهران، ایران | ||
3استادیار مهندسی کامپیوتر، دانشگاه پیام نور، تهران، ایران | ||
چکیده | ||
اخبار جعلی ورزشی که در شبکههای اجتماعی پخش میشوند برای ورزشکاران، باشگاههای ورزشی، ورزش دوستان و ... ناخوشایند هستند، پس تشخیص اخبار جعلی و غیرجعلی امری مهم و کاربردی است. این پژوهش، در چارچوب زبانشناسی رایانهای انجامگرفته است. پیکرهی زبانی این تحقیق بر اساس بارگیری اخبار ورزشی از تارنمای ایسنا و برنامۀ اینستاگرام بوده است؛ بدین صورت که اخبار ورزشی از تارنمای ایسنا در یک محدودۀ زمانی بارگیری شده است و سپس در چند صفحه برنامۀ اینستاگرام، اخبار ورزشی بارگیری شده و از لحاظ جعلی بودن یا غیرجعلی بودن با هم مقایسه شدهاند. برای شناسایی اخبار جعلی از غیرجعلی از روش ان-گرم و روش حافظه طولانی کوتاه-مدت (ال اس تی ام) استفاده شده است. روش پیشنهاد شده در این مقاله روی چهار دیتاست معتبر و موجود پیاده سازی شده و با شش روش پیشین مقایسه شده است. دقت این روش نسبت به دیگر روشها قابل قبول میباشد و نتایج به دست آمده، بیانگر این است که برای شناسایی اخبار جعلی، در میان خبرهای منتشر شده در اینستاگرام، این روش، مناسب میباشد و دقت کافی را دارد. | ||
کلیدواژهها | ||
اخبار جعلی؛ زبانشناسی رایانهای؛ ان-گرم؛ ال اس تی ام؛ الگوریتم متن کاوی؛ زبان فارسی؛ زبانشناسی اجتماعی | ||
عنوان مقاله [English] | ||
Detection of Fake Sport News Published in Instagram Social Network based on ISNA News Website: A Study on the Basis of Mining Algorithm in Persian Language | ||
نویسندگان [English] | ||
Morteza Dastlan1؛ Mahshid Dehbozorgi2؛ Behzad Moridi1؛ Mohsen Emami3 | ||
1Assistant Professor of General Linguistics, Payame Noor University, Tehran, Iran | ||
2M.A. in General Linguistics, Payame Noor University, Tehran, Iran | ||
3Assistant Professor of Computer Engineering, Payame Noor University, Tehran, Iran | ||
چکیده [English] | ||
The distribution of fake sport news is not based on the satisfaction of sport men, sport clubs and sport fans. Correspondingly, the identification of fake news is important and practical. This research has been done in the framework of computational linguistics. The linguistic data are based on a corpus of sports news from ISNA website and Instagram program. In this way, sports news is downloaded from the ISNA website in a period of time, and then in a few pages of the Instagram program, sports news is downloaded and compared in terms of being fake or not. The N-gram method and long and short term memory (LSTM) method have been used to identify fake news from non-fake ones. The method proposed in this paper has been implemented on four valid and existing datasets and has been compared with the previous six methods. The accuracy of this method is acceptable compared to other methods, and the results obtained indicate that this method is suitable and accurate enough to identify fake news among the news published on Instagram. | ||
کلیدواژهها [English] | ||
fake news, computational linguistics, N-gram, LSTM, mining algorithm, Persian language | ||
مراجع | ||
امیری، علی، عادل آذر و میثم شهبازی. (1399). ارائه رویکردی مبتنی بر برنامه ریزی تصادفی و زنجیره مارکوف به منظور بهینه سازی بازتولید و برون سپاری در زنجیره تامین. مطالعات مدیریت صنعتی. 18 (57). 1-42.
تاجیک اسماعیلی، سمیه، ابوالفضل علیپور و سروناز تربتی. (1399). نقش اینستاگرام در توسعه برند شخصی (مورد مطالعه: کاربران اینترنتی اینستاگرام، 1398). پژوهشهای ارتباطی. 27(3). 35-57.
ذاکری، مرتضی. (1396). مشخص کردن برچسب اجزای سخن.
سالاری، سیدمجتبی، و فضل الله ادیبنیا. (1389). 10 الگوریتم از برترینهای داده کاوی. سیزدهمین کنفرانس دانشجویی مهندسی برق ایران تربیت مدرس. 24-26.
سامانی، سمانه، و اعظم فراهانی. (1395). هویت آنلاین و اینستاگرام (مطالعه چگونگی نمایش هویت جوانان در اینستاگرام). رسانه. 27(2). 85-104.
صفوی, کورش. (1382). پژوهش درباره با همآیی واژگان در زبان فارسی. متن پژوهی ادبی. 7(18)، 1-13.
لاینز، جان. (1391). درآمدی بر معنیشناسی زبان، ترجمة کورش صفوی، تهران: علمی.
نیکوگفتار، هانیه، عباس بحرودی، بهزاد تخمچی، غلامحسین نوروزی، بهزاد مهرگینی. (1392). مدلسازی با زنجیره مارکوف، مطالعه موردی: رخسارههای سنگی یکی از مخازن نفتی جنوب باختر ایران. فصلنامه علمی-پژوهشی علوم زمین. 9، (1). 65-77.
Amirkhani, H., Jafari, M. A., Amirak, A., Pourjafari, Z., Jahromi, S. F., & Kouhkan, Z. (2020). Farstail: A Persian natural language inference dataset. arXiv preprint arXiv:2009.08820.
Chaffey, D. (2021). Global social media research summary 2016. Smart Insights: Social Media Marketing.
De Beer, D., & Matthee, M. (2020). Approaches to identify fake news: A systematic literature review. In International Conference on Integrated Science (pp. 13-22). Springer, Cham.
De Oliveira, N. R., Medeiros, D. S., & Mattos, D. M. (2020). A sensitive stylistic approach to identify fake news on social networking. IEEE Signal Processing Letters, 27, 1250-1254.
Gahirwal, M., Moghe, S., Kulkarni, T., Khakhar, D., & Bhatia, J. (2018). Fake news detection. International Journal of Advance Research, Ideas and Innovations in Technology, 4(1), 817-819.
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. Book in preparation for MIT Press. URL¡ http://www. deeplearningbook. org, 1.
Jimenez, M., Maxime, C., Le Traon, Y., & Papadakis, M. (2018). On the impact of tokenizer and parameters on n-gram based code analysis. In 2018 IEEE International Conference on Software Maintenance and Evolution (ICSME) (pp. 437-448).
Mertoğlu, U., & Genç, B. (2020). Automated fake news detection in the age of digital libraries. Information Technology and Libraries, 39(4). https://doi.org/10.6017/ital.v39i4.12483
Minyoung Huh, Andrew Liu, Andrew Owens, Alexei A. (2018). Fighting fake news: Image splice detection via learned self-consistency. Efros; Proceedings of the European Conference on Computer Vision (ECCV), pp. 101-117.
Veisi, H., & Sameti, H. (2013). Speech enhancement using hidden Markov models in Mel-frequency domain. Speech Communication, 55(2), 205-220. | ||
آمار تعداد مشاهده مقاله: 927 تعداد دریافت فایل اصل مقاله: 571 |