Читаем ChatGPT для саморазвития: Освоения программирования, консалтинга и изучения иностранных языков полностью

Для языка программирования Python мы будем использовать среду разработки Colab/Jupiter для тестирования наших решений. В случае работы с SAP мы будем использовать среду разработки SAP ERP, а для работы с MS Excel – MS Excel.

Мы убедимся, что предложенное решение, созданное с помощью ChatGPT, проходит тестирование в соответствующей среде разработки, что гарантирует его готовность для практического применения в вашей работе.

Шаг1 Загрузка и изучение данных

На этом шаге мы попробуем загрузить информацию из нашего датасета в среду разработки и получить общую информацию о данных.

Это позволит нам более детально изучить и понять наш набор данных, что в свою очередь поможет нам выбрать правильные инструменты и методы для анализа данных и решения поставленных задач.

Пользователь:

Напиши мне код на python – Открой файл titanic.csv с данными и изучите общую информацию по данному файлу и представь все в табличном виде.

Чат:

Для выполнения этого задания мы будем использовать библиотеку pandas.

Если у вас ее нет, установите с помощью команды:



Теперь, когда у вас есть библиотека pandas, следуйте приведенному ниже коду для открытия файла 'titanic.csv' и вывода общей информации о данных в табличном виде:



После выполнения этого кода вы увидите общую информацию о данных, такую как количество строк, столбцов, типы данных и количество непустых значений. Также вы увидите первые 10 строк данных для предварительного просмотра.

Учтите, что вам нужно будет заменить 'titanic.csv' на действительный путь к файлу CSV на вашем компьютере или URL-адрес файла, если он доступен онлайн.

Результат:

Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.



Шаг2 Предварительная обработка данных

Давайте попробуем предварительно обработать данные на этом шаге. Мы проверим на наличие дубликатов, пропущенных значений и другие аномалии. Мы не знаем, какое качество данных находится в нашем файле на входе, поэтому этот шаг очень важен для последующего анализа данных. Предварительная обработка позволит нам избавиться от мусорных значений и повысит качество нашего анализа.

Пользователь

Выведи все названия столбцов в одну строку и выполни шаги по предварительной обработке данных т.е. проверь на дубликаты, на наличие пропущенных значений и т.п. и выведи отчет по результатам предварительной обработки.

Чат:

Для выполнения этой задачи мы будем использовать библиотеку pandas.

Приведенный ниже код выполняет предварительную обработку данных и выводит отчет по результатам:







После выполнения этого кода вы получите отчет о предварительной обработке данных, включая количество удаленных дубликатов и заполненных пропущенных значений. Код также выводит первые 10 строк обработанных данных для предварительного просмотра.

Учтите, что вам нужно будет заменить 'titanic.csv' на действительный путь к файлу CSV на вашем компьютере или URL-адрес файла, если он доступен онлайн.

Результат:

Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.





Внимание:

Мы заметили, что при каждом ответе ChatGPT повторяется код, который устанавливает библиотеку pandas для работы с табличными данными, и загружает данные из нашего датасета в переменную data. Чтобы избежать повторения этого кода, мы можем поступить следующим образом:

Пропустить эти строки кода и использовать только код, который расположен ниже.

Конкретизировать наши запросы, напоминая ChatGPT о том, что библиотека pandas уже установлена, и что файл titanic.csv уже загружен в переменную data.

Кроме того, мы рекомендуем напоминать ChatGPT о том, какие названия столбцов у нас есть в датасете, и какого они типа. Это поможет нам точнее работать со столбцами в нашем датасете. Для этого мы можем попросить ChatGPT вывести названия столбцов и их типы в одну строку, которую мы сможем скопировать и использовать для конкретизации наших последующих запросов.

Пользователь:

Выведи в одну строку название столбцов и тип каждого столбца

Внимание:

Мы не указали, какой именно датасет мы должны использовать в данном запросе, потому что мы формируем запрос в текущем чате обсуждения, и ChatGPT будет анализировать предыдущие шаги, чтобы понять, какой датасет мы используем. Однако, если в текущем чате было выполнено много шагов или если есть несколько альтернативных датасетов, то необходимо конкретизировать запрос, указав, какой датасет нужно использовать.

Чат:

Для вывода названия столбцов и типа каждого столбца, используйте следующий код:



Результат:

Выполняем все рекомендации Чата и посмотрим смотрим что из этого получилось.



Внимание:

Как вы заметили, мы пропустили строки кода с импортом библиотеки pandas и загрузкой данных из CSV файла. Мы воспользовались ранее предложенным советом и пропустили эти строки кода, чтобы избежать повторения одних и тех же команд.

Шаг3 Визуализация и статистический данных

Перейти на страницу:

Похожие книги

Английский язык. Higher education
Английский язык. Higher education

Настоящее учебно-методическое пособие предназначено для студентов социально-экономического факультета ИПП как дневной, так и заочной формы обучения, изучающих социокультурный и/или лингвострановедческий курс английского языка. Рассчитано на 72 часа аудиторной работы для студентов гуманитарных и экономических специальностей на дневной форме обучения, 30 часов и 10 часов соответственно для студентов гуманитарных и экономических специальностей на заочной форме обучения, что отображено в разделе 1 пособия. Характер данного пособия определяется целью, которая ставится при обучении иностранным языкам в неязыковых вузах - углубление иноязычных знаний и формирование коммуникативных навыков и умений студента. Данное пособие призвано обеспечить студентов тематически упорядоченным языковым материалом, который может служить основой для развития и закрепления навыков, необходимых для глубокого понимания содержания иноязычного текста, анализа прочитанного, подготовки к монологической и диалогической речи, а также для письменных сообщений.

Екатерина Ивановна Филончик

Иностранные языки / Учебники
Английский с Шерлоком Холмсом. Человек с рассеченной губой / Arthur Conan Doyle. Sherlock Holmes
Английский с Шерлоком Холмсом. Человек с рассеченной губой / Arthur Conan Doyle. Sherlock Holmes

Несколько известных случаев из практики Шерлока Холмса в изложении его верного друга и спутника доктора Ватсона адаптированы в настоящем издании (без упрощения текста оригинала) по методу Ильи Франка: снабжены дословным переводом на русский язык и необходимым лексико-грамматическим комментарием.Уникальность метода заключается в том, что запоминание слов и выражений происходит за счет их повторяемости, без заучивания и необходимости использовать словарь. Кроме того, читатель привыкает к логике английского языка, начинает его «чувствовать».Пособие способствует эффективному освоению языка, может служить дополнением к учебной программе.Для широкого круга лиц, изучающих английский язык и интересующихся английской культурой.В формате PDF A4 сохранен издательский макет книги.

Андрей Еремин , Артур Конан Дойл

Иностранные языки / Образование и наука