-
Notifications
You must be signed in to change notification settings - Fork 0
Тижневі звіти
Solomiia Lenio edited this page Jun 8, 2019
·
18 revisions
Результат:
- Обрала тему пов'язану із діагностикою патологій травної системи на основі стану шкірного покриву.
- Опрацювала Інтернет-ресурси, пов'язані із обраною тематикою.
- Почала розробляти модель системи.
- Зіткнулася із недостатньою кількістю матеріалу для створення тренувального data set-у.
- Обрала тему пов'язану із аналізом реальних ідей депутатів ВР України.
- Чи існують і чи є у відкритому доступі, якщо існують, дані про те, що говорять депутати під час засідань ВР України?
Результат:
- Знайшла відкритий API Верховної Ради із необхідним набором даних.
- Створила модель системи та написала опис проекту.
- Розробила вимоги на систему та опис тематики дослідження.
- Створила репозиторій на GitHub та занесла відповідну документацію.
- Розробила прототип модуля для отримання стенограми із обраного ресурсу.
- Необхідність форматування тексту стенограми для зручнішої роботи із даними.
- У якій структурі даних доцільніше зберігати дані, отримані після аналізу стенограм?
Результат:
- Опрацювала структуру стенограм пленарних засідань верховної ради.
- Ознайомилася із функціональними моливостями модулів html та BeautifulSoup.
- Розробила модуль-приклад розбору стенограми за допомогою функціоналу BeautifulSoup.
- Провела аналіз отриманих даних та почала моделювання структури даних для їх опрацювання та зберігання.
Результат:
- Завершила моделювання структур даних.
- Почала розробку структур даних Politician та Convocation.
- Розробила функціональні та нефункціональні вимоги до системи.
- Розробила опис даних та решту необхідної документації.
- Почала роботу над файлом README.md .
Результат:
- Завершила розробку класів Politician та Convocation та їх функціоналу.
- Почала розробку класів Session та Idea.
- Почала вивчення NLP-алгоритмів.
- Яким має бути критерій "інформативності" абзацу?
- Як бути із абзацами, де більше ніж одна ключова позиція або її взагалі немає?
Результат:
- Продовжувала розробку класу Session.
- Завершила розробку класу Idea.
- Виникли проблеми із відносним шляхами до файлів та імпортом власних модулів.
Результат:
- Завершила розробку класу Session.
- Створила діаграми функціоналу класів та їх взаємов'язків.
- Виникли проблеми через не до кінця продуманий алгоритм.
Результат:
- Почала перший етап "збірки" функціоналу - файл main.py.
- Завершила алгоритм роботи програми.
- Покращувала форматування стенограми (метод format у класі Session).
- Почала роботу над класом Analyser.
Питання:
- Досі не визначилася із алгоритмом для аналізу тексту стенограм.
Результат:
- Працювала над документацією до курсової роботи.
- Ознайомилася із особливостями роботи із базами даних SQLAlchemy та їх поєднання із Flask-ом.
- Створила файл requirements.txt.
- Почала ознайомлюватися із матеріалами про text clusterization.
Результат:
- Обрала для реалізації метод tf-idf.
- Ознайомилася із функціоналом бібліотеки sklearn.
- Завершила роботу над класом Analyser.
- Оновила діаграми класів та відповідну документацію.
Результат:
- Розробила документацію для функцій.
- Відлагоджувала роботу модуля main.py та провела аналіз отриманих даних.
- Завантажила отримані дані у базу даних.
Результат:
- Розробила фінальну докуменацію для проекту.
- Створила дизайн для веб-сайту.
- Почала розробку веб-сайту для навігації результатами дослідження.
Politicians talk by sol4ik