Revealing of the Internet Dialects Manifestation of the Regions of the Russian Federation

Authors

  • Diana M. Mironova Southwest State University
  • Daniil I. Raspopin Southwest State University
  • Efrosinya A. Okuneva Southwest State University

DOI:

https://doi.org/10.52575/2712-7451-2022-41-2-339-350

Keywords:

computer linguistics, machine learning, regionalisms, Internet language, dialect, map

Abstract

Despite the ubiquity of school education, the standardization of the language and the presence of a literary norm, there are enough differences in the vocabulary of the language of the Internet network in different regions to successfully determine the regional affiliation of the text. So far, the question of the existence of dialects of the written language of the web has been insufficiently disclosed. The purpose of this study was to find and describe the dialects of the Internet language. The result has been to establish the existence of distinguishable dialect groups, to prove the influence of the geographical factor on the formation and distribution of these groups, and to group the subjects of the Russian Federation into dialect groups. The novelty of the research lies in the application of methods of machine learning and statistical analysis of big data in order to achieve the goals set. The results of the work contribute to the development of ideas of the language network as a heterogeneous structure, which may help to develop a more comprehensive view of the functioning of the Russian language and form new perspectives for its study.

Author Biographies

Diana M. Mironova, Southwest State University

Associate Professor at the Department of Theoretical and Applied Linguistics, Southwest State University, Kursk, Russia

Daniil I. Raspopin, Southwest State University

student of the cathedra of customs and global economics of South-West State University, Kursk, Russia

Efrosinya A. Okuneva, Southwest State University

student of the cathedra of theoretical and applied linguistics of South-West State University, Kursk, Russia

References

Классификация текстов с помощью сверточных нейронных сетей. 2017. Хабр. URL: https://habr.com/ru/post/332078/ (дата обращения: 10 сентября 2021).

Филин Ф.П. 1965. Словарь русских народных говоров. Вып. 1: А. М., Л., Наука, 303 с. URL: https://iling.spb.ru/dictionaries/srng/01.pdf (дата обращения: 10 февраля 2021).

Multinominal Naïve Bayes classifier documentation page, scikit-learn python API. 2007-2022. Scikit-learn. org. Available at: https://scikit-learn.org/stable/modules/generated/sklearn.naive_ bayes.MultinomialNB.html (accessed: 25 June 2021).

Алексеев М.Е. 2013. Языки народов России и постсоветского пространства: проблемы изучения и перспективы развития. Родной язык, 1: 8–17.

Бадрах А., Ширнэн Ц. 2015. К вопросу о функционировании русского языка в интернет среде. Вестник Новосибирского государственного педагогического университета, 5 5): 134–141. URL: http://sciforedu.ru/article/1573 (дата обращения: 8 февраля 2021). DOI: http://dx.doi.org/10.15293/2226-3365.1505.12.

Булатова И.З., Билялова А.А. 2021. Особенности интернет-коммуникации в системе национального русского языка. Международный научно-исследовательский журнал,

-3(105): 107–110. URL: https://research-journal.org/wp-content/uploads/2021/03/3-105-3.pdf (дата обращения: 9 августа 2021). DOI: 10.23670/IRJ.2021.105.3.080.

Буриева М. 2021. О симплификации языка в интернет-пространстве. Вестник Московского государственного лингвистического университета. Гуманитарные науки, 5(847): 22–33. URL: http://www.vestnik-mslu.ru/Vest/5_847_H.pdf (дата обращения: 19 августа 2021). DOI: 10.52070/2542-2197_2021_5_847_22

Голев Н.Д. 2019. Дискурсивный словарь диалектной лексики новейшего времени (на материалах рунета): инновационный лексикографический проект. Вопросы лексикографии, 16: 113–137. DOI: 10.17223/22274200/16/7.

Иванова Т.С. 2011. Речевое поведение Интернет-общения. Вестник Адыгейского государственного университета. Серия 2: Филология и искусствоведение, 3: 132–136.

Игнатенко И.И. 2009. Языковые и коммуникативные процессы в эпоху глобализации. Наука и школа, 3: 24–27.

Кондрашева Е.В., Тинина А.О. 2019. Новая лексика языка интернета: способы образования, причины появления. Эпоха науки, 18: 134–139. URL: http://eraofscience.com/EofS/Vypyski2019/18_iyun2019/30.pdf (дата обращения: 19 августа 2021). DOI: 10.24411/2409-3203-2018-11830.

Лексический атлас русских народных говоров (материалы и исследования). 2014. Под ред. А.С. Герда. Санкт-Петербург, Издательство Нестор-История, 808 с. URL: https://elibrary.ru/item.asp?Id=23245144 (дата обращения: 10 февраля 2021).

Лемешко Б.Ю. 1997. Робастное оценивание параметров распределений. Заводская лаборатория. Диагностика материалов, 63(5): 43–49. URL: https://ami.nstu.ru/~ headrd/seminar/publik_html/Z_lab_1.htm (accessed: 19 августа 2021).

Лутовинова О.В. 2008. Интернет как новая ‘устно-письменная’ система коммуникации. Известия Российского государственного педагогического университета имени А.И. Герцена, 11(71): 58–65.

Минакова И.В., Распопин Д.И., Окунева Е.А. 2021. Исследование диалектов в письменной речи социальных сетей. Modern Humanities Success, 3: 211–221. URL: https://mhs-journal.ru/wp-content/uploads/2021/03/mhs-3.pdf (дата обращения: 10 февраля 2021).

Мирзоева Л.Ю. 2019. Словотворчество в интернет-сети и проблемы экологии языка. Экология языка и коммуникативная практика, 2(17): 26–34. URL: http://ecoling.sfu-kras.ru/wp-content/uploads/2019/08/4.-Mirzoeva-L.Yu_..pdf (дата обращения: 4 сентября 2021). DOI: 10.17516/2311-3499-055.

Нелюбина Е.А., Амитрова М.В., Гусарова Ю.В. 2014. Языковые особенности интернет-дискурса. Балтийский гуманитарный журнал, 4(9): 21–23.

Петрухина Е.В., Дедова О.В. 2019. Интернет как источник лингвистической информации (для изучения динамики русского словообразования) Вестник Томского государственного университета. Филология, 57: 137–159. DOI: 10.17223/19986645/57/8.

Хазеев Д.Р. 2019. Приложение нейронных сетей к определению стиля текста. Новые информационные технологии в автоматизированных системах, 22. Вып.: Новые информационные технологии в автоматизированных системах. Материалы двадцать второго научно-практического семинара, г. Москва, 19 апреля 2019 г. М., ВШЭ: 121–124.

Kulkarni V., Perozzi B., Skiena S. 2015. Freshman or Fresher? Quantifying the Geographic Variation of Internet Language. Available at: arXiv:1510.06786 [cs.CL] (accessed: 25 June 2021). DOI: https://doi.org/10.48550/arXiv.1510.06786

Leng Z. 2012. A study of the features of Internet language. In: 2nd International Conference on Consumer Electronics, Communications and Networks (CECNet), Yichang, China, 21-23 April 2012. IEEE Xplore: 97-100. Available at: https://ieeexplore.ieee.org/document/6201466 (accessed: 21 June 2021). DOI: 10.1109/CECNet.2012.6201466.

Manning C.D., Raghavan P., Schuetze H. 2008. Introduction to Information Retrieval. Cambridge University Press, 506 р. DOI:

https://doi.org/10.1017/CBO9780511809071.


Abstract views: 256

Share

Published

2022-07-06

How to Cite

Mironova, D. M., Raspopin, D. I., & Okuneva, E. A. (2022). Revealing of the Internet Dialects Manifestation of the Regions of the Russian Federation. Issues in Journalism, Education, Linguistics, 41(2), 339-350. https://doi.org/10.52575/2712-7451-2022-41-2-339-350

Issue

Section

Linguistics