Определение выраженности интернет-диалектов субъектов Российской Федерации
DOI:
https://doi.org/10.52575/2712-7451-2022-41-2-339-350Ключевые слова:
компьютерная лингвистика, машинное обучение, регионализмы, язык интернет-сети, диалект, картаАннотация
Несмотря на повсеместное распространение школьного образования, стандартизацию языка и наличие литературной нормы, в лексике языка интернет-сетей в различных регионах присутствует достаточно различий, чтобы успешно определять региональную принадлежность текста. До сих пор в недостаточной степени раскрыт вопрос о существовании диалектов письменного языка сети. Целью данного исследования являлся поиск и описание диалектов языка интернета. В результате удалось установить существование различимых диалектных групп, доказать влияние географического фактора на формирование и распределение этих групп, а также сгруппировать субъекты Российской Федерации в группы по диалектному признаку. Новизна исследования заключается в применении методов машинного обучения и статистического анализа больших данных для выполнения поставленных целей. Результаты работы способствуют развитию представлений о языке сети как о неоднородной структуре, что может помочь развить более комплексный взгляд на функционирование русского языка и сформировать новые перспективы его изучения.
Библиографические ссылки
Классификация текстов с помощью сверточных нейронных сетей. 2017. Хабр. URL: https://habr.com/ru/post/332078/ (дата обращения: 10 сентября 2021).
Филин Ф.П. 1965. Словарь русских народных говоров. Вып. 1: А. М., Л., Наука, 303 с. URL: https://iling.spb.ru/dictionaries/srng/01.pdf (дата обращения: 10 февраля 2021).
Multinominal Naïve Bayes classifier documentation page, scikit-learn python API. 2007-2022. Scikit-learn. org. Available at: https://scikit-learn.org/stable/modules/generated/sklearn.naive_ bayes.MultinomialNB.html (accessed: 25 June 2021).
Алексеев М.Е. 2013. Языки народов России и постсоветского пространства: проблемы изучения и перспективы развития. Родной язык, 1: 8–17.
Бадрах А., Ширнэн Ц. 2015. К вопросу о функционировании русского языка в интернет среде. Вестник Новосибирского государственного педагогического университета, 5 5): 134–141. URL: http://sciforedu.ru/article/1573 (дата обращения: 8 февраля 2021). DOI: http://dx.doi.org/10.15293/2226-3365.1505.12.
Булатова И.З., Билялова А.А. 2021. Особенности интернет-коммуникации в системе национального русского языка. Международный научно-исследовательский журнал,
-3(105): 107–110. URL: https://research-journal.org/wp-content/uploads/2021/03/3-105-3.pdf (дата обращения: 9 августа 2021). DOI: 10.23670/IRJ.2021.105.3.080.
Буриева М. 2021. О симплификации языка в интернет-пространстве. Вестник Московского государственного лингвистического университета. Гуманитарные науки, 5(847): 22–33. URL: http://www.vestnik-mslu.ru/Vest/5_847_H.pdf (дата обращения: 19 августа 2021). DOI: 10.52070/2542-2197_2021_5_847_22
Голев Н.Д. 2019. Дискурсивный словарь диалектной лексики новейшего времени (на материалах рунета): инновационный лексикографический проект. Вопросы лексикографии, 16: 113–137. DOI: 10.17223/22274200/16/7.
Иванова Т.С. 2011. Речевое поведение Интернет-общения. Вестник Адыгейского государственного университета. Серия 2: Филология и искусствоведение, 3: 132–136.
Игнатенко И.И. 2009. Языковые и коммуникативные процессы в эпоху глобализации. Наука и школа, 3: 24–27.
Кондрашева Е.В., Тинина А.О. 2019. Новая лексика языка интернета: способы образования, причины появления. Эпоха науки, 18: 134–139. URL: http://eraofscience.com/EofS/Vypyski2019/18_iyun2019/30.pdf (дата обращения: 19 августа 2021). DOI: 10.24411/2409-3203-2018-11830.
Лексический атлас русских народных говоров (материалы и исследования). 2014. Под ред. А.С. Герда. Санкт-Петербург, Издательство Нестор-История, 808 с. URL: https://elibrary.ru/item.asp?Id=23245144 (дата обращения: 10 февраля 2021).
Лемешко Б.Ю. 1997. Робастное оценивание параметров распределений. Заводская лаборатория. Диагностика материалов, 63(5): 43–49. URL: https://ami.nstu.ru/~ headrd/seminar/publik_html/Z_lab_1.htm (accessed: 19 августа 2021).
Лутовинова О.В. 2008. Интернет как новая ‘устно-письменная’ система коммуникации. Известия Российского государственного педагогического университета имени А.И. Герцена, 11(71): 58–65.
Минакова И.В., Распопин Д.И., Окунева Е.А. 2021. Исследование диалектов в письменной речи социальных сетей. Modern Humanities Success, 3: 211–221. URL: https://mhs-journal.ru/wp-content/uploads/2021/03/mhs-3.pdf (дата обращения: 10 февраля 2021).
Мирзоева Л.Ю. 2019. Словотворчество в интернет-сети и проблемы экологии языка. Экология языка и коммуникативная практика, 2(17): 26–34. URL: http://ecoling.sfu-kras.ru/wp-content/uploads/2019/08/4.-Mirzoeva-L.Yu_..pdf (дата обращения: 4 сентября 2021). DOI: 10.17516/2311-3499-055.
Нелюбина Е.А., Амитрова М.В., Гусарова Ю.В. 2014. Языковые особенности интернет-дискурса. Балтийский гуманитарный журнал, 4(9): 21–23.
Петрухина Е.В., Дедова О.В. 2019. Интернет как источник лингвистической информации (для изучения динамики русского словообразования) Вестник Томского государственного университета. Филология, 57: 137–159. DOI: 10.17223/19986645/57/8.
Хазеев Д.Р. 2019. Приложение нейронных сетей к определению стиля текста. Новые информационные технологии в автоматизированных системах, 22. Вып.: Новые информационные технологии в автоматизированных системах. Материалы двадцать второго научно-практического семинара, г. Москва, 19 апреля 2019 г. М., ВШЭ: 121–124.
Kulkarni V., Perozzi B., Skiena S. 2015. Freshman or Fresher? Quantifying the Geographic Variation of Internet Language. Available at: arXiv:1510.06786 [cs.CL] (accessed: 25 June 2021). DOI: https://doi.org/10.48550/arXiv.1510.06786
Leng Z. 2012. A study of the features of Internet language. In: 2nd International Conference on Consumer Electronics, Communications and Networks (CECNet), Yichang, China, 21-23 April 2012. IEEE Xplore: 97-100. Available at: https://ieeexplore.ieee.org/document/6201466 (accessed: 21 June 2021). DOI: 10.1109/CECNet.2012.6201466.
Manning C.D., Raghavan P., Schuetze H. 2008. Introduction to Information Retrieval. Cambridge University Press, 506 р. DOI:
Просмотров аннотации: 256
Поделиться
Опубликован
Как цитировать
Выпуск
Раздел
Copyright (c) 2022 Диана Михайловна Миронова , Даниил Игоревич Распопин , Ефросинья Андреевна Окунева
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.