목록빅데이터 (7)
now is better than never
[엔지니어링] 리눅스 (1)
리눅스 오라클 : 정형화된 데이터, SQL 하둡 / 스파크 : 비정형화(사진, 동영상), 반정형화(html 소스) 된 데이터, 클라우드 코랩은 우분투 기반 -> 리눅스 명령어 사용 가능 명령줄 맨 앞에 ! 붙여서 리눅스 명령어 실행 리눅스로 데이터를 가져오는 이유 : 데이터 파이프 라인 구현 파이프 라인 생성 = 데이터를 뽑아서 저장하는 자동화 플로우를 구현 데이터 엔지니어 -> 리눅스 쉘 프로그래밍을 이용해서 자동화 구현 명령어 cd [경로] : 경로로 이동, 뒤에 아무것도 없으면 root로 이동 cd .. : 상위 디렉토리로 이동 (상대 경로) pwd : 현재 디렉토리의 절대 경로 출력 mkdir [directory] : 현재 경로에 하위 디렉토리 생성 rm [name] : [name] 파일이나 디렉..
빅데이터
2023. 4. 11. 19:25