написал парсер для темы форума (любой).
суть проблемы-есть темы на форуме, в которых содержится до 1000 комментов. Так вот, читать их, перелистывая по 5 штук на страницу,
утомительно. Для оптимизации процесса был и создан парсер, который собирает все комменты в одну excel таблицу.
Как работает:
1.запустить данный скрипт: python3 smartliving4.py
2.ввести ссылку на тему для парсинга, например: viewtopic.php?f=7&t=1871
3.на выходе получается файл smartliving.csv в директории, где установлен python
4.открыть smartliving.csv в notepad++ (или аналоге), перевести кодировку в "Кодировка в utf-8".
сохранить файл как *.txt
5. открыть Excel. скопировать все из файла *.txt в Excel, выбрав в Excel вставить-специальная вставка.
Для примера приложил файл excel c темой форума "Еще немного обновлений".
ps. в теме "наводим порядок с темами" еще еще один парсер - он собирает все комменты на форуме по поисковому слову.
парсер(просмотр) темы форума в сжатом виде
Модератор: immortal
-
- Сообщения: 158
- Зарегистрирован: Вт авг 23, 2016 3:08 pm
- Откуда: Москва
- Благодарил (а): 5 раз
- Поблагодарили: 22 раза
- Контактная информация:
парсер(просмотр) темы форума в сжатом виде
- Вложения
-
- парсер темы форума.rar
- (306.06 КБ) 180 скачиваний
- Рейтинг: 1.16%
Raspberry pi3 на X820 с собственного образа MJD, broadlink rm mini3, sonoff basic, самодельные погодные станции и wi-fi розетки на esp8266 esp-01.физический robot-дворецкий.