Архив блога Президента России

Описание

- medblog_csv.7z (1.7 МВ архив, 22 MB после распаковки) -в формате CSV, не включает полных текстов комментариев
- medblog_mongodb.7z (49 MB архив, 491 MB после распаковки) - в формате BSON, дампа для MongoDB.
- medblog_json.7z (48 MB архив, 504 MB после распаковки) - в формате JSON для импорта в MongoDB или аналогичные базы
В каждом архив данные следующих таблиц:
- posts - посты в блоге
- themes - темы в блоге
- users - пользователи (оставившие хотя бы 1 комментарий)
- regions - регионы пользователей (регион "Неизвестно" относится к пользователям его не указавшим)
- comments - все комментарии пользователей к постам и темам
- stats - статистика. Автоматически построенная статистика на основе данных о постах и комментариях

Адрес / Url

http://blog.kremlin.ru

Тип сайта

Специализированный сайт

Файлы

Название Размер файла Дата выгрузки
medblog_csv.7z 1700000 Ноя. 23, 2011
medblog_json.7z 49000000 Ноя. 23, 2011
medblog_mongodb 49000000 Ноя. 24, 2011

Даты

Дата внесения:Июнь 7, 2011, 9:04 п.п.
Дата обновления:Июнь 7, 2011, 9:04 п.п.

blog comments powered by Disqus