优秀的编程知识分享平台

网站首页 > 技术文章 正文

「jupyter」Google Colab使用外部数据的几种方法

nanyue 2024-12-08 17:06:06 技术文章 8 ℃

方法1:通过Files explorer上传

点击Notebook的Files explorer面板:

然后点击上传按钮:

当上传结束后,就可以直接读取:


方法2:使用Colabfiles上传

输入并运行下面代码:

from google.colab import files
uploaded = files.upload()

然后就可以选择对应的文件,完成上传:

方法3:读取Github链接

在github页面找到对应的文件路径,注意是文件的Raw链接:

然后将链接写到对应的位置。

方法4:克隆Github项目

先从命令行下载项目:

!git clone https://github.com/BindiChen/machine-learning.git

然后从对应的路径完成数据读取。


方法5:使用wget/axel下载文件

在Notebook中可以使用Linux系统命令,可以使用wgetaxel下载数据:

方法6:读取谷歌硬盘数据

挂载了谷歌硬盘后,写好路径完成读取:

方法7:Kaggle API完成数据下载

首先在Kaggle账户的Kaggle API,点击Create New API Token,会下载一个kaggle.json文件。

kaggle.json文件上传后,就可以使用kaggle-api下载比赛数据或者数据集。

安装kaggle的API,然后下载数据集。

!pip install -U -q kaggle
!mkdir -p ~/.kaggle
!echo '{"username":"abc","key":"123"}' > ~/.kaggle/kaggle.json
!chmod 600 ~/.kaggle/kaggle.json
 
!kaggle competitions download -c digit-recognizer
!kaggle competitions download -c titanic
!kaggle datasets download -d alexanderbader/forbes-billionaires-2021-30


 # 使用网络云盘保存
import os
from google.colab import drive
 #运行后点击链接,复制密钥 
drive.mount('./mount')
#注意kaggle文件夹包含json文件 
os.environ['KAGGLE_CONFIG_DIR'] = '/content/mount/MyDrive/Colab Notebooks/kaggle' 
os.chdir('/content/mount/MyDrive/Colab Notebooks/kaggle') #切换到kaggle文件夹 
!kaggle competitions download -c cassava-leaf-disease-classification#下载数据集即可 
!unzip cassava-leaf-disease-classification.zip#解压数据集
最近发表
标签列表