Анализ больших объемов данных: возможности GDELT Project при использовании языка программирования Python. Опыт гуманитария, решившего постичь Big Data

Авторы

DOI:

https://doi.org/10.14515/monitoring.2021.1.1750

Ключевые слова:

GDELT, Big Data, Python, BigQuery

Аннотация

Научный мир развивается по междисциплинарному пути, одно из самых популярных направлений — соединение возможностей программирования, позволяющего обрабатывать большие объемы данных, и гуманитарного знания. В статье я описываю свой опыт освоения Big Data, анализирую возможности ресурса GDELT и показываю, как с помощью команд на языке программирования Python обрабатывать большие данные. Благодаря этому данная статья может иметь и вполне практическое применение — в ней перечислены и проанализированы шаги, которые позволят ученым, не знакомым с обработкой больших объемов данных, не только разобраться в сути метода, но и самостоятельно сделать первые шаги в обработке данных на Python. Кроме того, работа проиллюстрирована кейсом французских «желтых жилетов», что позволяет лучше разобраться в структуре кода и принципах работы GDELT.

Биография автора

Наталья Владимировна Ярцева, Самарский университет

  • Самарский университет, Самара, Россия
    • кандидат политических наук, доцент
  • Всероссийский центр изучения общественного мнения, Москва, Россия
    • эксперт-консультант

Опубликован

2021-03-04

Выпуск

Раздел

Методы и методология