블로그 키워드를 추출하는데 Google Trends는 유용한 툴 중 하나다.
파이썬을 통해 구글 트렌드 데이터를 가져올 수 있다는 거 알고 있나?
api를 이용하면 직접들어가서 데이터를 확인할 필요도, 크롤링 없이 데이터를 손쉽게 가져올 수 있다.
이번 포스팅을 통해 키워드 작업 자동화를 배워보자.
이 글과 읽으면 좋은글
Google Trends API 설치
파이썬 코드는 코랩 환경에서 진행한다.
우선 필요한 api 라이브러리를 설치하자.
!pip install pytrends
일별 인기 급상승 검색어 추출
인기 급상승 검색어를 파이썬을 통해 추출 해보겠다.
from pytrends.request import TrendReq
pytrends = TrendReq(hl='ko-KR', tz=540)
df = pytrends.trending_searches(pn='south_korea')
print(df)
#output
0 국민연금공단
1 김건희
2 박지원
3 이낙연
4 현대자동차 채용
5 근로장려금
6 올리브영
7 김태희
8 임은정
9 토익
10 러시아
11 꽃샘추위
12 보조금
13 김성철
14 아이스크림
15 미스터트롯
16 조민
17 예금
18 골프장
19 위스키
hl => Host Language의 약자로, Google 트렌드의 언어를 설정하는 파라미터(한국어는 'ko-KR'이다.)
tz => Timezone Offset의 약자로 UTCF부터의 시차를 분 단위로 표시(한국은 '540'이다.)
pn => south_korea 대한민국으로 설정
최대 20개 값을 output으로 보여준다.
검색 키워드 트렌드 그래프 그리기
검색어를 입력했을 때 해당 검색어의 변화를 그래프로 표시해 주는 기능이 있다.
이를 파이썬 코드로 구현해보면 아래와 같다.
from pytrends.request import TrendReq
import matplotlib.pyplot as plt
pytrends = TrendReq(hl='ko-KR', tz=540)
kw_list = ['chatgpt']
pytrends.build_payload(kw_list, timeframe='2022-12-01 2023-03-03', geo='KR')
df = pytrends.interest_over_time()
df.plot()
kw_list => 검색하고자 하는 검색어 기입
timeframe => 원하는 기간을 입력
geo => 한국에 해당하는 'KR' 입력
관련검색어
(1) 급상승 키워드
from pytrends.request import TrendReq
import pandas as pd
pytrends = TrendReq(hl='ko-KR', tz=540)
kw_list = ['chatgpt']
pytrends.build_payload(kw_list, timeframe='2022-12-01 2023-03-03', geo='KR')
df = pytrends.related_queries()
result_rising = pd.concat([df[kw]['rising'] for kw in kw_list], axis=0)
result_rising = result_rising.sort_values(by='value', ascending=False).reset_index(drop=True)
result_rising
[ic]value[/ic]에 적혀 있는 숫자는 절대적인 수치가 아니다.
특정 기간 대비 얼마나 검색률이 상승했는지 판단하는 지표다.
인기 있다고 해서 좋은 키워드가 아닐 수 있다. 왜냐하면 일시적 상승일 수 있기 때문이다.
앞서 배웠던 키워드 그래프를 통해 해당 키워드의 유용성을 파악할 수 있다.
(2) 인기 키워드
이번에는 급상승은 아니지만 꾸준하게 인기 있는 키워드를 추출하는 방법이다.
from py trends.request import TrendReq
import pandas as pd
pytrends = TrendReq(hl='ko-KR', tz=540)
kw_list = ['chatgpt']
pytrends.build_payload(kw_list, timeframe='2022-12-01 2023-03-03', geo='KR')
df = pytrends.related_queries()
result_top = pd.concat([df[kw]['top'] for kw in kw_list], axis=0)
result_top = result_top.sort_values(by='value', ascending=False).reset_index(drop=True)
result_top
인기 키워드의 [ic]value[/ic]도 상대적인 개념이다.
[ic]0~100[/ic]으로 표시되고 [ic]100[/ic]이 가장 인기 있는 키워드라면 나머지는 그에 따라 상대적인 정도를 나타낸다.
주의할 점은 [ic]100[/ic]이라고 해도 해당 키워드의 절대적 검색량이 적다면 큰 의미가 없을 수 있다.
이때는 구글 키워드 플래너를 통해 검색량을 확인해 보자.
'재테크 | 부업 > 블로그 | 구글 애드센스' 카테고리의 다른 글
[챗gpt] ChatGPT plus 유료 결제 하지마세요. (0) | 2023.03.17 |
---|---|
[챗gpt] chatgpt api 사용법 : 따라하며 배우는 초보자용 (12) | 2023.03.17 |
[파이썬] 티스토리 블로그 자동 포스팅 방법(with open api)(2) (1) | 2023.03.15 |
[챗gpt] chatgpt 설치/ 사용법(쌩기초) (1) | 2023.03.08 |
죽어가는 포스팅 살리기 (0) | 2023.03.08 |
댓글