April 23

Улучшение прогнозирования в рекламе социальных сетей, через расширение данных.

Аннотация: В условиях постоянного развития рекламы в социальных сетях точность прогностических моделей играет ключевую роль для повышения эффективности взаимодействия с аудиторией. В данной работе рассматривается рамочная модель генеративного расширения данных с использованием трех различных моделей: генеративных состязательных сетей (GAN), вариационных автокодировщиков (VAE) и гауссовых смесевых моделей (GMM). Эти методы преодолевают ограничения небольших или смещенных наборов данных, обогащая разнообразие и доступность данных, что способствует улучшению прогностической производительности различных классификаторов в рекламе социальных сетей.

1. Введение Ландшафт цифрового маркетинга, особенно реклама в социальных сетях, зависит от надежности прогностической аналитики, страдающей от ограниченности и предвзятости данных. Наше исследование направлено на решение этих проблем через использование расширения данных для улучшения объема и разнообразия данных, повышая тем самым производительность предсказательных моделей.

2. Методы Исследование включает в себя всесторонний подход, начиная с сбора и предварительной обработки данных, за которыми следует расширение данных с помощью GAN, VAE и GMM. Анализируется эффективность этих моделей в создании синтетических данных, которые отражают разнообразие реальных наборов данных.

3. Сбор и предварительная обработка данных Исходный набор данных содержал различные аспекты поведения пользователей в социальных сетях, которые обрабатывались методами очистки данных, нормализации и кодирования категориальных переменных. После этого набор данных был разделен на обучающую и тестовую выборки, чтобы сохранить иерархическую структуру исходных данных.

4. Рамочная модель Методологическая рамка включала три фазы: расширение данных, обучение и тестирование. Этот многоэтапный подход позволил интегрировать и оценить влияние синтетических данных на различные прогностические модели.

5. Генерация синтетических данных Синтетические данные были созданы с использованием GAN, VAE и GMM, создавая обогащенный набор данных, который использовался для обучения нескольких машинных классификаторов, включая деревья решений, нейронные сети и машины опорных векторов.

6. Обучение классификационных моделей Исследовалась производительность шести различных классификаторов, обученных сначала на исходном наборе данных, а затем на расширенных данных. Метрики производительности сравнивались для

оценки влияния расширения данных.

7. Оценка производительности Основными метриками оценки были точность классификации, F1-мера и AUC. Эти метрики помогли оценить эффективность расширения данных в улучшении прогностической точности моделей.

8. Этические соображения Этические аспекты критически оценивались, чтобы процесс генерации синтетических данных не привел к введению или усилению предвзятостей.

9. Эксперименты и результаты Экспериментальные результаты показали значительное улучшение производительности моделей благодаря расширению данных. Данные, сгенерированные с помощью VAE, показали наибольшее улучшение, что указывает на их потенциал в предоставлении разнообразного и репрезентативного синтетического набора данных.

10. Заключение Это исследование подтверждает, что расширение данных может значительно улучшить прогностическое моделирование в рекламе социальных сетей, преодолевая ограничения, связанные с нехваткой данных и предвзятостью. Сравнительный анализ GAN, VAE и GMM выделяет VAE как наиболее эффективный метод, что открывает путь для будущих исследований и практического применения в цифровом маркетинге.

11. Обсуждение В заключение статьи обсуждаются более широкие последствия расширения данных, предлагая направления для будущих исследований, которые могли бы исследовать более продвинутые техники и их влияние на справедливость и предвзятость моделей.

Это исследование значительно продвигает понимание и применение расширения данных в прогностической аналитике, предоставляя ценные знания, которые могут трансформировать стратегии рекламы в социальных сетях и разработку моделей.