Eat Study Love

먹고 공부하고 사랑하라

Coding_Practice

Google Colab에 Google Drive 연결하기

eatplaylove 2025. 4. 9. 14:20

Jupyter notebook으로 Python code를 짜는 작업을 할 때, Python Module 들을 Local에 일일히 다 저장하면 은근히 용량도 많이 차지하고, 그것보다 문제인건 가끔 Module 간 Version 차이가 발생해 Module Import 시 Error가 발생한다.

 

소이 뻑이간 상태인데, 이게 한 두 건이면 그냥 무시하고 쓰는데 머신러닝 세계에선 Import 해야하는 Module이 생각보다 많다. 그래서 그냥 Google Colab으로 코드를 짜기도 한다.

 

대신, Google Colab은 기본적으로 Temporary 한 VM환경이기 때문에 Colab 세션을 껐다 킬 때는 설치했던 Package들이 모두 사라진다. 그리하여, 기본적으로 CELL 안에 pip install같은 코드를 적어놔야 한다.

✅ Colab에서의 기본 구조

Colab에서 사용하는 파일 시스템은 아래와 같아:
  • /content/ → Colab의 임시 작업 디렉토리 (RAM에 저장됨)
  • /content/drive/ → Google Drive가 마운트되는 지점
  • /content/drive/MyDrive/ → 내 드라이브 루트 폴더 (즉, 내가 Google Drive에서 직접 보는 최상위 폴더)

 

Google Drive에 저장된 Data를 이용해서 코드를 Colab에서 짜고 싶을때 기본 구조는 아래와 같고,

이때 Directory 관련 정보는 위와 같다.

 

from google.colab import drive
import pandas as pd
import os

# 1. Drive 마운트
drive.mount('/content/drive')

# 2. 데이터 읽기
input_path = '/content/drive/MyDrive/data/my_dataset.csv'
df = pd.read_csv(input_path)

# 3. 새 데이터 생성 (예: 상위 10개만 추출)
top10 = df.head(10)

# 4. 저장할 폴더 경로 만들기
output_folder = '/content/drive/MyDrive/results'
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# 5. CSV 저장
output_path = os.path.join(output_folder, 'top10_output.csv')
top10.to_csv(output_path, index=False)

 

만약 Directory가 헷갈린다면, 아래 Colab 환경에서 직접 눈으로 파일들의 위치를 확인할 수도 있다.

✅ 1. Colab 좌측 ‘Files’ 탭에서 경로 복사하기

  1. Colab 왼쪽 메뉴바에서 📁 Files 탭 클릭
  2. drive 폴더 아래로 → MyDrive → Colab_Notebooks → data
  3. bird_dev.json 파일을 찾았다면, 우클릭 → Copy path
📌 복사한 경로는 정확한 전체 경로여서 아래처럼 써주면 돼:

✅ 2. !ls 명령어로 직접 확인하기

Colab 코드창에 다음처럼 입력해서 실제로 어떤 파일이 있는지 확인할 수 있어:
혹은 전체 경로 탐색도 가능:
❗만약 파일명이 bird_dev.JSON처럼 대소문자 다르거나, 오타가 있을 수도 있어!

✅ 3. 확실하게 하고 싶으면 glob 사용하기

그럼 [ '/content/drive/MyDrive/Colab_Notebooks/data/bird_dev.json' ]처럼 리스트로 나올 거야.
여기서 파일명이 정확히 뭔지 확인할 수 있음!

 

Interface는 좀 꾸지지만, 이런저런 이유로 Colab에서 코딩을 하는 것에 적응을 한다면 훗날 도움이 많이 될 거 같다.