티스토리 뷰

저번 글에서 MYSQL 데이터를 HDFS로 옮겨봤는데요

이번에는 옮겨던 HDFS 데이터를 다시 Hive로 옮겨보겠습니다.

 

 

저번에 HDFS로 import해서 가져온 데이터입니다.

 

hive 라고 입력하면 hive cli로 변경됩니다.

 

먼저 hdfs_retail_db라는 database를 만들어줍니다.

 

그리고 categories라는 테이블을 만들고 HDFS에 있는 데이터와 동일한 데이터 타입으로 각 column을 다음과 같이 정의합니다.

 

load data inpath 'HDFS에서 옮기려는 데이터' into table 테이블이름 으로 입력해줍니다.

 

다음 쿼리를 통해 HDFS에서 Hive로 성공적으로 데이터를 옮긴 것을 확인할 수 있습니다.