Читаем ChatGPT для саморазвития: Освоения программирования, консалтинга и изучения иностранных языков полностью

Для языка программирования Python мы будем использовать среду разработки Colab/Jupiter для тестирования наших решений. В случае работы с SAP мы будем использовать среду разработки SAP ERP, а для работы с MS Excel – MS Excel.

Мы убедимся, что предложенное решение, созданное с помощью ChatGPT, проходит тестирование в соответствующей среде разработки, что гарантирует его готовность для практического применения в вашей работе.

<p>Шаг1 Загрузка и изучение данных</p>

На этом шаге мы попробуем загрузить информацию из нашего датасета в среду разработки и получить общую информацию о данных.

Это позволит нам более детально изучить и понять наш набор данных, что в свою очередь поможет нам выбрать правильные инструменты и методы для анализа данных и решения поставленных задач.

Пользователь:

Напиши мне код на python – Открой файл titanic.csv с данными и изучите общую информацию по данному файлу и представь все в табличном виде.

Чат:

Для выполнения этого задания мы будем использовать библиотеку pandas.

Если у вас ее нет, установите с помощью команды:

Теперь, когда у вас есть библиотека pandas, следуйте приведенному ниже коду для открытия файла 'titanic.csv' и вывода общей информации о данных в табличном виде:

После выполнения этого кода вы увидите общую информацию о данных, такую как количество строк, столбцов, типы данных и количество непустых значений. Также вы увидите первые 10 строк данных для предварительного просмотра.

Учтите, что вам нужно будет заменить 'titanic.csv' на действительный путь к файлу CSV на вашем компьютере или URL-адрес файла, если он доступен онлайн.

Результат:

Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.

<p>Шаг2 Предварительная обработка данных</p>

Давайте попробуем предварительно обработать данные на этом шаге. Мы проверим на наличие дубликатов, пропущенных значений и другие аномалии. Мы не знаем, какое качество данных находится в нашем файле на входе, поэтому этот шаг очень важен для последующего анализа данных. Предварительная обработка позволит нам избавиться от мусорных значений и повысит качество нашего анализа.

Пользователь

Выведи все названия столбцов в одну строку и выполни шаги по предварительной обработке данных т.е. проверь на дубликаты, на наличие пропущенных значений и т.п. и выведи отчет по результатам предварительной обработки.

Чат:

Для выполнения этой задачи мы будем использовать библиотеку pandas.

Приведенный ниже код выполняет предварительную обработку данных и выводит отчет по результатам:

После выполнения этого кода вы получите отчет о предварительной обработке данных, включая количество удаленных дубликатов и заполненных пропущенных значений. Код также выводит первые 10 строк обработанных данных для предварительного просмотра.

Учтите, что вам нужно будет заменить 'titanic.csv' на действительный путь к файлу CSV на вашем компьютере или URL-адрес файла, если он доступен онлайн.

Результат:

Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.

Внимание:

Мы заметили, что при каждом ответе ChatGPT повторяется код, который устанавливает библиотеку pandas для работы с табличными данными, и загружает данные из нашего датасета в переменную data. Чтобы избежать повторения этого кода, мы можем поступить следующим образом:

Пропустить эти строки кода и использовать только код, который расположен ниже.

Конкретизировать наши запросы, напоминая ChatGPT о том, что библиотека pandas уже установлена, и что файл titanic.csv уже загружен в переменную data.

Кроме того, мы рекомендуем напоминать ChatGPT о том, какие названия столбцов у нас есть в датасете, и какого они типа. Это поможет нам точнее работать со столбцами в нашем датасете. Для этого мы можем попросить ChatGPT вывести названия столбцов и их типы в одну строку, которую мы сможем скопировать и использовать для конкретизации наших последующих запросов.

Пользователь:

Выведи в одну строку название столбцов и тип каждого столбца

Внимание:

Мы не указали, какой именно датасет мы должны использовать в данном запросе, потому что мы формируем запрос в текущем чате обсуждения, и ChatGPT будет анализировать предыдущие шаги, чтобы понять, какой датасет мы используем. Однако, если в текущем чате было выполнено много шагов или если есть несколько альтернативных датасетов, то необходимо конкретизировать запрос, указав, какой датасет нужно использовать.

Чат:

Для вывода названия столбцов и типа каждого столбца, используйте следующий код:

Результат:

Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.

Внимание:

Как вы заметили, мы пропустили строки кода с импортом библиотеки pandas и загрузкой данных из CSV файла. Мы воспользовались ранее предложенным советом и пропустили эти строки кода, чтобы избежать повторения одних и тех же команд.

<p>Шаг3 Визуализация и статистический данных</p>
Перейти на страницу:

Похожие книги

Письмо на английском языке: примеры, как писать (личное, деловое, резюме, готовые письма как образец)
Письмо на английском языке: примеры, как писать (личное, деловое, резюме, готовые письма как образец)

Как писать письмо на английском языке? Пособие представляет собой собрание образцов писем на английском языке, затрагивающих самые разнообразные стороны повседневной жизни. Это дружеские и деловые письма, письма – приглашения в гости и письма-благодарности, письма-извинения и письма-просьбы.Книга знакомит с этикетом написания письма на английском языке, некоторыми правилами английской пунктуации и орфографии, а также содержит справочные материалы, необходимые при написании писем.Пособие рассчитано на широкий круг лиц, владеющих английским языком в той или иной степени и стремящихся поддерживать письменные контакты с представителями англоязычных стран. Может использоваться как учебник английского языка, репетитор английского.Книга основана на ускоренных методах изучения иностранных языков.

Денис Александрович Шевчук

Языкознание, иностранные языки / Иностранные языки / Образование и наука
Новые письма темных людей (СИ)
Новые письма темных людей (СИ)

Перед Вами – шедевр новой латинской литературы. Автор – единственный российский писатель, пишущий на латинском языке, – представляет Вам свою новую книгу. В ней он высмеивает невежественных политиков, журналистов и блогеров. Консерваторы и либералы, коммунисты и ультраправые, – никого он  не щадит в своем сочинении. Изначально эта книга была издана от имени Константина Семина, – известного проправительственного журналиста, – и сразу снискала успех. Сейчас мы издаем ее уже от имени настоящего автора, – непримиримого левака и коммуниста.    Помимо «Новых писем темных людей» в это издание вошли многие новые работы Марата Нигматулина, написанные как на латинском, так и на русском языке.               

Автор Неизвестeн

Публицистика / Критика / Контркультура / Сатира / Иностранные языки