무효 클릭 IP 추적 중...
파이썬

챗gpt와 LangChain을 이용한 데이터분석과 시각화 마스터하기

꼬예 2023. 6. 3.

챗지피티가 데이터 분석도 하고 그래프까지 그린다는데 믿겨지시나요?

데이터 사이언티스트도 이제 AI의 영향력이 미치는 범위에 들어오기 시작했습니다.

세상이 참 빠르게 변하고 있네요.

 

이번 포스팅에서는 챗gpt를 활용한 데이터 분석 방법을 알아볼겁니다.

 

 

바로 LangChainagent라는 기능입니다.

 

기존 쳇지피티에서는 사용자가 적절한 프롬프트를 제공하여 문제를 해결했지만 , agent는 스스로 프롬프트를 만들어 문제를 해결합니다. 

최근 프롬프트 엔지니어링이 떠오르고 있는데 AI가 이 자리까지 노리고 있는거죠.

 

이제 본론으로 들어가 사용법에 대해 알아보겠습니다.

해당 예제는 코랩 환경에서 진행됩니다. 코랩 사용법은 모르시는 분은 이 글을 참조하시기 바랍니다.

 

사용방법

Langchain 설치

아래 명령어를 이용하여 Langchain을 설치해줍니다.

langchain설치
lnagchain 설치

 

API 키 등록

여러분의  api 키를 기입해 줍니다.

api-key-등록

Api key 얻는 방법을 모르시는 분은 해당 포스팅을 읽고 와주시기 바랍니다.

 

데이터 등록

다음은 데이터를 준비하는 단계입니다.

 

csv, excel 파일 형식에 따라 읽어오는 방법이 조금씩 다를 수 있습니다.

아래 예제 코드를 참고해 주세요.

 

import pandas as pd

# CSV 파일 경로
csv_file_path = '파일경로.csv'

# CSV 파일 읽기
df = pd.read_csv(csv_file_path)

 

import pandas as pd

# Excel 파일 경로
excel_file_path = '파일경로.xlsx'

# Excel 파일 읽기
df = pd.read_excel(excel_file_path)

 

이번 예제에서는 실제 파일을 읽어오는 대신 임의의 데이터를 생성해 보도록 하겠습니다.

데이터-등록

 

agent 객체 생성

아래와 같이 코드를 작성하여 agent 객체를 생성해 줍니다.

agent-객체-생성

temperature란?
temperature은 인공지능의 창의성 정도를 의미합니다.
0~1까지 선택이 가능한데요.
우리는 창의성보단 정확한 분석을 필요로 하니까 0으로 세팅합니다.

 

프롬프트 작성하기

agent에게 명령 날리기

막대 색이 다른 여러 국가의 GDP를 표시하는 히스토그램을 만들고, X축을 국가 이름으로, Y축을 GDP로 설정해 주세요.

 

출력창을 보면  agent가 문제를 어떻게 해결하는지 그 과정을 볼 수 있습니다.

agent-사고-과정
Agent의 사고 과정

 

agent가 요구에 맞게 그래프를 생성해줍니다.

결과그래프(1)

 

다른 요청도 시도해 볼까요?

agent-에게-요청(2)

각 국가의 GDP와 행복지수를 사용하여 산점도를 만들어주세요. 평균 행복지수와 GDP에 대해 가로 및 세로선을 추가해야 합니다

 

결과그래프(2)

 

 

 

전체코드는 아래🔽 파일을 통해 다운받을 수 있습니다.

langchain agent 전체코드.txt
0.00MB

 

 

결론

chatgpt를 이용한 시각화 너무 쉬워서 당황스럽지 않으셨나요?

하지만 그래프의 디테일한 면이 아쉬운 점이 있고 무엇보다 속도가 조금 느리다는 단점이 있습니다.

 

기술은 항상 발전하는 법, 그래서 더 빠르고 뛰어난 성능을 가진 새로운 친구를 소개하려고 하는데요.

궁금하시다면 다음 포스팅을 확인해주세요!

 

챗GPT 완벽 가이드 보기

  • 트위터 공유하기
  • 페이스북 공유하기
  • 카카오톡 공유하기
이 컨텐츠가 마음에 드셨다면 커피 한잔(후원) ☕

댓글