Публикации по теме data-science

Публикации по теме 'data-science'

Эмодзи: разберемся с этим на Python 🤗

Что такое библиотека эмодзи в Python? Как работать с эмодзи в Python. Библиотека эмодзи в Python — это набор инструментов, функций или ресурсов, которые позволяют программно работать с эмодзи. Эти библиотеки предоставляют методы для простой обработки эмодзи, такие как кодирование, декодирование, поиск, замена и управление ими в строках или тексте. эмодзи Смайлик — это небольшое цифровое изображение или значок, используемый для выражения идеи, эмоции, концепции или объекта в..

Как повысить продуктивность работы в области науки о данных: PyCharm + Anaconda + JupyterLab

Как начать писать код для науки о данных Вступление Не поймите меня неправильно - мы всегда хотим повысить нашу продуктивность - за то же время мы можем выполнить больше работы. Это верно и для исследователей в области науки о данных. После того, как вы настроили оборудование, пришло время подумать о том, как выбрать программное обеспечение, необходимое для начала ваших проектов в области науки о данных. Проблема в том, что на рынке слишком много вариантов, и в целях обучения вы,..

Кодирование RNN в PyTorch

🌟 Весь код доступен на Github: https://github.com/hahahumble/Coding-RNN-PyTorch Рекуррентная нейронная сеть (RNN) – это искусственная нейронная сеть, использующая последовательные данные или данные временных рядов . Рекуррентные нейронные сети дают нейронным сетям память, поэтому они широко используются в машинном переводе, распознавании речи и так далее. В PyTorch RNN строится с использованием класса torch.nn.RNN . Вы можете узнать о его параметрах, входах и выходах здесь:..

Лучший EDA с профилированием Pandas

Исследовательский анализ данных мертв, да здравствует профилирование Pandas! Идеальный обзор ваших данных с меньшими усилиями. Мир, полный плохих данных В основном в Data Science , данные, которые мы собираем, не такие чистые и полные, как доступные в Интернете наборы данных, разработанные и подготовленные для применения моделей машинного обучения. В основном данные поступают из внешних источников, плохо структурированы или просто неполны, и ваша задача - сделать эти данные..

5 различных способов сохранить вашу модель машинного обучения

Упрощение процесса повторного использования моделей Сохранение обученных моделей машинного обучения — важный шаг в рабочем процессе машинного обучения: это позволяет повторно использовать их в будущем. Например, весьма вероятно, что вам придется сравнивать модели, чтобы определить лучшую модель для запуска в производство — сохранение моделей после их обучения упрощает этот процесс. Альтернативой может быть обучение модели каждый раз, когда ее необходимо использовать, что может..

Моделирование временных рядов с новым подходом к данным

Расширьте возможности структуры данных, улучшите процесс обработки данных Данные временного ряда представляют собой последовательность точек данных, проиндексированных во временном порядке. Наиболее распространенным примером данных временных рядов является дневная цена закрытия фондового рынка. Анализ временных рядов может помочь организациям понять основные причины тенденций или системных закономерностей с течением времени. В этом посте мы продемонстрируем пакет..

Исследование границ клинических данных коротких временных рядов с нерегулярной выборкой (ISSTS): скрытые закономерности…

Для выявления клинически значимых идей требуется другой набор аналитических методов, чем тот, к которому мы привыкли. Как выглядит такой набор инструментов? В предыдущей статье мы определили проблему анализа данных коротких временных рядов с нерегулярной выборкой, или сокращенно ISSTS. VaDER был определен как многообещающий аналитический метод, который одновременно изучает скрытые представления и кластеризует назначения входных выборок. В ходе внедрения VaDER было выявлено несколько..