Jupyter notebook으로 Python code를 짜는 작업을 할 때, Python Module 들을 Local에 일일히 다 저장하면 은근히 용량도 많이 차지하고, 그것보다 문제인건 가끔 Module 간 Version 차이가 발생해 Module Import 시 Error가 발생한다.
소이 뻑이간 상태인데, 이게 한 두 건이면 그냥 무시하고 쓰는데 머신러닝 세계에선 Import 해야하는 Module이 생각보다 많다. 그래서 그냥 Google Colab으로 코드를 짜기도 한다.
대신, Google Colab은 기본적으로 Temporary 한 VM환경이기 때문에 Colab 세션을 껐다 킬 때는 설치했던 Package들이 모두 사라진다. 그리하여, 기본적으로 CELL 안에 pip install같은 코드를 적어놔야 한다.
✅ Colab에서의 기본 구조Colab에서 사용하는 파일 시스템은 아래와 같아:
|
Google Drive에 저장된 Data를 이용해서 코드를 Colab에서 짜고 싶을때 기본 구조는 아래와 같고,
이때 Directory 관련 정보는 위와 같다.
from google.colab import drive
import pandas as pd
import os
# 1. Drive 마운트
drive.mount('/content/drive')
# 2. 데이터 읽기
input_path = '/content/drive/MyDrive/data/my_dataset.csv'
df = pd.read_csv(input_path)
# 3. 새 데이터 생성 (예: 상위 10개만 추출)
top10 = df.head(10)
# 4. 저장할 폴더 경로 만들기
output_folder = '/content/drive/MyDrive/results'
if not os.path.exists(output_folder):
os.makedirs(output_folder)
# 5. CSV 저장
output_path = os.path.join(output_folder, 'top10_output.csv')
top10.to_csv(output_path, index=False)
만약 Directory가 헷갈린다면, 아래 Colab 환경에서 직접 눈으로 파일들의 위치를 확인할 수도 있다.

✅ 1. Colab 좌측 ‘Files’ 탭에서 경로 복사하기
✅ 2. !ls 명령어로 직접 확인하기Colab 코드창에 다음처럼 입력해서 실제로 어떤 파일이 있는지 확인할 수 있어:혹은 전체 경로 탐색도 가능: ❗만약 파일명이 bird_dev.JSON처럼 대소문자 다르거나, 오타가 있을 수도 있어! ✅ 3. 확실하게 하고 싶으면 glob 사용하기그럼 [ '/content/drive/MyDrive/Colab_Notebooks/data/bird_dev.json' ]처럼 리스트로 나올 거야.여기서 파일명이 정확히 뭔지 확인할 수 있음! |
Interface는 좀 꾸지지만, 이런저런 이유로 Colab에서 코딩을 하는 것에 적응을 한다면 훗날 도움이 많이 될 거 같다.

'Coding_Practice' 카테고리의 다른 글
Smallest Positive Integer (0) | 2025.02.24 |
---|---|
Convert Sorted List to Binary Search Tree(Linked List,Divide and Conquer,Tree,Binary Search Tree,Binary Tree) (0) | 2025.02.17 |
Subtree of Another Tree() (0) | 2025.02.13 |
Combination Sum(Array,Backtracking) (0) | 2025.02.12 |
Subsets(Array,Backtracking,Bit Manipulation) (0) | 2025.02.11 |