Шаг 1: Изучение доступных датасетов (20 мин)Откройте описание всех 7 предложенных датасетов.
Для каждого датасета определите:
- Основную предметную область (продажи, музыка, путешествия и т.д.)
- Сложность данных (количество полей, временной период)
- Потенциал для интересного анализа
Выберите 2-3 наиболее интересных датасета.
Критерии выбора для новичков:
- Понятная предметная область
- Наличие временных данных для трендов
- Достаточное количество записей (>1000)
- Разнообразие типов полей (числовые, текстовые, даты)
Шаг 2: Глубокий анализ выбранного датасета (25 мин)- Скачайте файл для одного выбранного датасета
- Откройте в Excel/Google Sheets.
- Создайте таблицу анализа структуры:
Название поля | Тип данных | Примеры значений | Пропуски | Потенциал для анализа |
Order_Date | Дата | 2024-01-15 | 0 | Тренды по времени |
Category | Текст | Pizza, Drinks | 5 | Сравнение категорий |
Выявите основные характеристики:
- Количество записей и полей
- Временной период данных
- Основные категории и сегменты
- Наличие пропусков и аномалий
Шаг 3: Формулировка бизнес-задач (25 мин)Методика SMART для бизнес-вопросов:
- Specific (Конкретный): Что именно мы хотим узнать?
- Measurable (Измеримый): Какие метрики будем анализировать?
- Actionable (Действенный): Какие решения примем на основе ответа?
- Relevant (Релевантный): Важно ли это для бизнеса?
- Time-bound (Ограниченный во времени): За какой период анализируем?
Шаблоны вопросов для разных типов анализа:Для продаж (Pizza Sales, Mobile Phones):
- "Какие [продукты/категории] приносят наибольшую выручку?"
- "В какие [дни недели/месяцы] продажи максимальны?"
- "Какой [размер/бренд] имеет лучшую рентабельность?"
- "Как изменилась динамика продаж за [период]?"
Для контента (Netflix, Spotify):
- "Какие [жанры/исполнители] наиболее популярны?"
- "Как изменились предпочтения пользователей за [период]?"
- "В каких [странах/регионах] контент наиболее востребован?"
- "Какие характеристики влияют на [рейтинг/популярность]?"
Для услуг (Uber, Airlines):
- "В какое время суток спрос наибольший?"
- "Какие [маршруты/направления] наиболее популярны?"
- "Как сезонность влияет на [количество поездок/рейсов]?"
- "Какие факторы влияют на [стоимость/задержки]?"