ubuntu24.04上jupyterlab的安装

对象OS:ubuntu24.04 (AWS的EC2 m6a.large)

web服务器:nginx

jupyter作为subpath安装,而不是subdomain安装。

不是通过docker来安装,而是作为python的一个应用来安装。

1.python虚拟环境的安装

我个人喜欢poetry来管理。

curl -sSL https://install.python-poetry.org | python3 -
export PATH="/home/ubuntu/.local/bin:$PATH"

下面是Poetry的初期设定:

sudo mkdir -p /data/.cache/pypoetry
sudo mkdir -p /data/.local/share/pypoetry
sudo chown -R ubuntu:ubuntu /data/.cache
sudo chown -R ubuntu:ubuntu /data/.local

定义Poetry的数据存储位置:

vi .profile
  POETRY_DATA_DIR=/data/.local/share/pypoetry

vi .bashrc
  POETRY_DATA_DIR=/data/.local/share/pypoetry
source .profile
source .bashrc

以下是poetry虚拟环境的设定(重点):

poetry config --list
poetry config virtualenvs.in-project true
poetry config cache-dir /data/.cache/pypoetry

2.jupyter的安装

poetry安装好了后,就可以创建一个虚拟环境(env)来执行jupyterlab了。

sudo mkdir /data/juplab
sudo chown -R ubuntu:ubuntu /data/juplab
cd /data/juplab
poetry init

以上是虚拟环境的初期化,基本上默认值。
下面重点来了,安装shell插件。
poetry self add poetry-plugin-shell

不安装插件的时候,得用下面的命令进入虚拟环境:
eval $(poetry env activate)

安装了插件后,就只要下面的一句话:
poetry shell

重点:shell的插件安装必须的。要不然进入到poetry的虚拟环境比较费劲。

安装了shell的插件,可以用poetry shell进入虚拟环境。


进入虚拟环境后,添加jupyterlab的package,然后启动

cd /data/juplab
poetry init
poetry shell
poetry add jupyterlab

先生成密码——不用担心记不住,密码存放在/home/ubuntu/.jupyter/jupyter_lab.json里
jupyter lab password

3.配置jupyter

重点:token无效化,password认证有效化,外部访问有效化,以及作为subpath的设定

jupyter --config-dir
jupyter lab --generate-config
vi /home/ubuntu/.jupyter/jupyter_lab_config.py
  c.ServerApp.ip = '0.0.0.0'
  c.ServerApp.port = 8030
  c.IdentityProvider.token = ''
  c.PasswordIdentityProvider.hashed_password = u'xxx'
  c.PasswordIdentityProvider.allow_password_change = False
  c.ServerApp.open_browser = False
  c.ServerApp.allow_remote_access = True
  c.ServerApp.allow_origin = '*'
  c.ExtensionApp.open_browser = False
  c.ServerApp.base_url = '/subpath4lab'

jupyter –config-dir:确认配置文件的路径

jupyter lab –generate-config:生成默认的配置文件

4.jupyter作为ubuntu的service设定

jupyter作为service启动配置如下:

sudo vi /etc/systemd/system/jupyter.service

[Unit]
Desctiption = Jupyter Lab
After = syslog.target

[Service]
Type = simple
WorkingDirectory = /data/privlab
Restart = always
ExecStart = /home/ubuntu/.local/bin/poetry run jupyter lab
User = ubuntu
Group = ubuntu

[Install]
WantedBy = multi-user.target

然后daemon重新加载,服务自启动有效化:

sudo systemctl daemon-reload
sudo systemctl start jupyter.service
sudo systemctl status jupyter.service
sudo systemctl enable jupyter.service

这个时候可以通过浏览器访问了:

http://server-ip:8030/subpath4lab

5.nginx代理jupyter的设定

通常我们会把jupyter挂载在自己网站下的,web服务器是nginx的时候,配置比较简单,如下:

location /subpath4lab {
        proxy_pass http://127.0.0.1:8030;
        proxy_http_version 1.1;
        proxy_set_header Upgrade $http_upgrade;
        proxy_set_header Connection "upgrade";
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_redirect off;
        proxy_buffering off;
        proxy_read_timeout 86400;
       
        auth_basic "Restricted";
        auth_basic_user_file /etc/nginx/.securepswd;
}

主要难点是websocket的配置,这个在nginx里,一个Upgrade和Connection “update”搞定!

为了防止他人利用,还增加了basic auth认证,实际上还要追加fail2ban之类的。详细看fail2ban的设定篇。

设置完之后,就可以通过域名访问了。

https://domain/subpath4lab/lab