e29eef47f1
- Añadir PASO 0 para detectar estado del repo (MCP instalado, repo configurado, Jupyter corriendo) - Reglas de Jupyter ahora se insertan al PRINCIPIO de CLAUDE.md - Nuevas conversaciones detectan automáticamente si el repo tiene Jupyter habilitado - Autodetección de puerto libre (8888-8899) - Script run-jupyter-lab.sh guarda puerto en .jupyter-port
332 lines
8.9 KiB
Markdown
332 lines
8.9 KiB
Markdown
---
|
|
name: init-jupyter
|
|
description: Inicializa entorno Jupyter para exploración de datos con MCP compartido. Autodetecta puerto y configura repo.
|
|
argument-hint: [ruta-proyecto]
|
|
disable-model-invocation: true
|
|
user-invocable: true
|
|
allowed-tools: Bash, Read, Write, Edit, Glob
|
|
---
|
|
|
|
# Inicializar Entorno Jupyter para Data Science
|
|
|
|
Skill para preparar cualquier repo para exploración de datos con Jupyter + Claude colaborando en kernel compartido.
|
|
|
|
## PASO 0: Verificar estado actual del repo
|
|
|
|
**Ejecutar estas comprobaciones primero:**
|
|
|
|
```bash
|
|
# 1. ¿MCP instalado globalmente?
|
|
which jupyter-mcp-server && echo "MCP_OK" || echo "MCP_NO"
|
|
|
|
# 2. ¿Repo ya configurado para Jupyter?
|
|
[ -f .claude/settings.local.json ] && grep -q "jupyter" .claude/settings.local.json && echo "REPO_CONFIG_OK" || echo "REPO_NO_CONFIG"
|
|
|
|
# 3. ¿Jupyter corriendo en este repo?
|
|
pgrep -af "jupyter" | grep "$(pwd)" && echo "JUPYTER_RUNNING" || echo "JUPYTER_STOPPED"
|
|
|
|
# 4. ¿CLAUDE.md tiene reglas Jupyter?
|
|
[ -f .claude/CLAUDE.md ] && grep -q "JUPYTER HABILITADO" .claude/CLAUDE.md && echo "RULES_OK" || echo "RULES_NO"
|
|
```
|
|
|
|
### Resultado: MCP NO instalado
|
|
|
|
```bash
|
|
uv tool install jupyter-mcp-server
|
|
```
|
|
|
|
Informar:
|
|
```
|
|
MCP jupyter-mcp-server instalado.
|
|
Ejecuta /exit y vuelve a entrar para recargar.
|
|
Después ejecuta /init-jupyter de nuevo.
|
|
```
|
|
**DETENER AQUÍ**
|
|
|
|
### Resultado: Repo YA configurado + Jupyter corriendo
|
|
|
|
Informar:
|
|
```
|
|
Este repo ya tiene Jupyter configurado y está corriendo.
|
|
Puedes empezar a trabajar directamente con notebooks via MCP.
|
|
```
|
|
**DETENER AQUÍ** (no hace falta reconfigurar)
|
|
|
|
### Resultado: Repo YA configurado + Jupyter NO corriendo
|
|
|
|
Informar:
|
|
```
|
|
Este repo tiene Jupyter configurado pero no está corriendo.
|
|
Ejecuta ./run-jupyter-lab.sh en otra terminal para iniciarlo.
|
|
```
|
|
**DETENER AQUÍ**
|
|
|
|
### Resultado: Repo NO configurado → Continuar con PASO 1
|
|
|
|
---
|
|
|
|
## PASO 1: Detectar ruta de trabajo
|
|
|
|
```bash
|
|
RUTA="${1:-.}"
|
|
cd "$RUTA"
|
|
pwd
|
|
```
|
|
|
|
---
|
|
|
|
## PASO 2: Verificar si Jupyter ya corre en ESTE repo
|
|
|
|
```bash
|
|
# Buscar proceso jupyter con el directorio actual
|
|
REPO_PATH=$(pwd)
|
|
pgrep -af "jupyter" | grep -E "(lab|notebook)" | grep "$REPO_PATH" || echo "NO_JUPYTER"
|
|
```
|
|
|
|
- Si encuentra proceso → Informar "Jupyter ya está corriendo en este repo" y saltar a Paso 6
|
|
- Si NO encuentra → Continuar
|
|
|
|
---
|
|
|
|
## PASO 3: Detectar puerto libre (autodetección)
|
|
|
|
```bash
|
|
# Encontrar primer puerto libre entre 8888-8899
|
|
for port in 8888 8889 8890 8891 8892 8893 8894 8895 8896 8897 8898 8899; do
|
|
if ! lsof -i:$port >/dev/null 2>&1; then
|
|
echo $port
|
|
break
|
|
fi
|
|
done
|
|
```
|
|
|
|
Guardar el puerto detectado para usarlo en los siguientes pasos.
|
|
|
|
---
|
|
|
|
## PASO 4: Crear/Actualizar archivos del proyecto
|
|
|
|
### 4a. Crear estructura si no existe
|
|
|
|
```bash
|
|
mkdir -p .claude notebooks
|
|
```
|
|
|
|
### 4b. Crear `run-jupyter-lab.sh` con puerto autodetectado
|
|
|
|
Crear el archivo con el PUERTO detectado en Paso 3:
|
|
|
|
```bash
|
|
cat > run-jupyter-lab.sh << 'SCRIPT'
|
|
#!/bin/bash
|
|
# Jupyter Lab para colaboración Claude + Usuario
|
|
# Generado por /init-jupyter
|
|
|
|
# Autodetectar puerto libre
|
|
find_free_port() {
|
|
for port in 8888 8889 8890 8891 8892 8893 8894 8895 8896 8897 8898 8899; do
|
|
if ! lsof -i:$port >/dev/null 2>&1; then
|
|
echo $port
|
|
return
|
|
fi
|
|
done
|
|
echo 8888
|
|
}
|
|
|
|
PORT=${1:-$(find_free_port)}
|
|
|
|
# Guardar puerto para que Claude lo lea
|
|
echo $PORT > .jupyter-port
|
|
|
|
# Activar entorno si existe
|
|
source .venv/bin/activate 2>/dev/null || true
|
|
|
|
echo "══════════════════════════════════════════════════════"
|
|
echo " Jupyter Lab iniciando en puerto $PORT"
|
|
echo "══════════════════════════════════════════════════════"
|
|
echo ""
|
|
echo " Abre: http://localhost:$PORT"
|
|
echo ""
|
|
echo " Claude se conectará al kernel cuando abras un notebook"
|
|
echo " Usa Ctrl+C para detener"
|
|
echo ""
|
|
echo "══════════════════════════════════════════════════════"
|
|
|
|
jupyter lab \
|
|
--port=$PORT \
|
|
--no-browser \
|
|
--NotebookApp.token='' \
|
|
--NotebookApp.password='' \
|
|
--NotebookApp.disable_check_xsrf=True \
|
|
--ServerApp.allow_origin='*' \
|
|
--ServerApp.root_dir="$(pwd)"
|
|
SCRIPT
|
|
chmod +x run-jupyter-lab.sh
|
|
```
|
|
|
|
### 4c. Crear/Actualizar `.claude/settings.local.json`
|
|
|
|
Usar el PUERTO detectado:
|
|
|
|
```bash
|
|
cat > .claude/settings.local.json << EOF
|
|
{
|
|
"mcpServers": {
|
|
"jupyter": {
|
|
"command": "jupyter-mcp-server",
|
|
"args": [
|
|
"--jupyter-url", "http://localhost:PUERTO",
|
|
"--start-new-runtime", "false"
|
|
]
|
|
}
|
|
}
|
|
}
|
|
EOF
|
|
```
|
|
|
|
(Reemplazar PUERTO por el valor real detectado)
|
|
|
|
### 4d. Añadir/Actualizar instrucciones en `.claude/CLAUDE.md`
|
|
|
|
**IMPORTANTE**: Las reglas de Jupyter deben ir AL PRINCIPIO del archivo para que nuevas conversaciones las vean inmediatamente.
|
|
|
|
**Lógica de inserción:**
|
|
|
|
1. Verificar si existe `.claude/CLAUDE.md`
|
|
2. Si existe:
|
|
- Leer contenido actual
|
|
- Si NO contiene "JUPYTER HABILITADO" → prepend (añadir al principio)
|
|
- Si YA contiene → no modificar
|
|
3. Si no existe → crearlo con las reglas
|
|
|
|
**Contenido a insertar AL PRINCIPIO:**
|
|
|
|
```markdown
|
|
# JUPYTER HABILITADO EN ESTE REPO
|
|
|
|
Este repositorio está configurado para exploración de datos con Jupyter + Claude.
|
|
|
|
## Estado del entorno
|
|
- **Lanzador**: `./run-jupyter-lab.sh`
|
|
- **Puerto config**: ver `.jupyter-port` o `.claude/settings.local.json`
|
|
- **MCP**: jupyter-mcp-server configurado
|
|
|
|
## Reglas OBLIGATORIAS para Claude
|
|
|
|
### 1. SIEMPRE usar MCP jupyter para ejecutar código Python
|
|
- Las ejecuciones se ven en tiempo real en Jupyter Lab del usuario
|
|
- Compartimos variables y estado del kernel
|
|
- **NUNCA usar bash para ejecutar Python en este repo**
|
|
|
|
### 2. Verificar Jupyter activo ANTES de ejecutar
|
|
```bash
|
|
pgrep -af "jupyter" | grep "$(pwd)" || cat .jupyter-port 2>/dev/null
|
|
```
|
|
- Si no está activo → pedir al usuario: "Ejecuta `./run-jupyter-lab.sh` en otra terminal"
|
|
|
|
### 3. Gestión de notebooks
|
|
- Si un notebook tiene >50 celdas → crear uno nuevo
|
|
- Nombrar descriptivamente: `01_exploracion.ipynb`, `02_limpieza.ipynb`
|
|
- Mantener notebooks enfocados en una tarea
|
|
|
|
### 4. Antes de código pesado
|
|
- Avisar al usuario
|
|
- Usar `%%time` o `tqdm` para progreso
|
|
|
|
---
|
|
|
|
```
|
|
|
|
**Comando bash para prepend:**
|
|
|
|
```bash
|
|
# Si CLAUDE.md existe y NO tiene las reglas
|
|
if [ -f .claude/CLAUDE.md ]; then
|
|
if ! grep -q "JUPYTER HABILITADO" .claude/CLAUDE.md; then
|
|
# Prepend: crear temp con reglas + contenido original
|
|
cat > .claude/CLAUDE.md.tmp << 'JUPYTER_RULES'
|
|
[CONTENIDO DE REGLAS AQUÍ]
|
|
JUPYTER_RULES
|
|
cat .claude/CLAUDE.md >> .claude/CLAUDE.md.tmp
|
|
mv .claude/CLAUDE.md.tmp .claude/CLAUDE.md
|
|
fi
|
|
else
|
|
# Crear nuevo
|
|
cat > .claude/CLAUDE.md << 'JUPYTER_RULES'
|
|
[CONTENIDO DE REGLAS AQUÍ]
|
|
JUPYTER_RULES
|
|
fi
|
|
```
|
|
|
|
---
|
|
|
|
## PASO 5: Inicializar entorno Python si no existe
|
|
|
|
### 5a. Si no existe `pyproject.toml`:
|
|
|
|
```bash
|
|
uv init 2>/dev/null || true
|
|
uv venv 2>/dev/null || true
|
|
```
|
|
|
|
### 5b. Instalar dependencias de Jupyter:
|
|
|
|
```bash
|
|
source .venv/bin/activate 2>/dev/null || true
|
|
uv add jupyter jupyterlab pandas numpy matplotlib 2>/dev/null || pip install jupyter jupyterlab pandas numpy matplotlib
|
|
```
|
|
|
|
---
|
|
|
|
## PASO 6: Resumen final al usuario
|
|
|
|
Mostrar:
|
|
|
|
```
|
|
═══════════════════════════════════════════════════════════════
|
|
Entorno Jupyter configurado en: [RUTA]
|
|
═══════════════════════════════════════════════════════════════
|
|
|
|
Puerto asignado: [PUERTO]
|
|
|
|
Para empezar:
|
|
1. En otra terminal ejecuta: ./run-jupyter-lab.sh
|
|
2. Abre http://localhost:[PUERTO] en tu navegador
|
|
3. Crea o abre un notebook
|
|
4. Yo me conecto automáticamente al kernel compartido
|
|
|
|
Archivos creados/actualizados:
|
|
- run-jupyter-lab.sh (lanzador)
|
|
- .claude/settings.local.json (config MCP)
|
|
- .claude/CLAUDE.md (reglas de trabajo)
|
|
|
|
═══════════════════════════════════════════════════════════════
|
|
```
|
|
|
|
---
|
|
|
|
## Comandos útiles post-inicialización
|
|
|
|
```bash
|
|
# Ver puerto actual
|
|
cat .jupyter-port
|
|
|
|
# Verificar Jupyter corriendo
|
|
pgrep -af jupyter
|
|
|
|
# Listar kernels activos
|
|
curl -s http://localhost:$(cat .jupyter-port)/api/kernels | jq
|
|
|
|
# Listar notebooks abiertos
|
|
curl -s http://localhost:$(cat .jupyter-port)/api/sessions | jq
|
|
```
|
|
|
|
---
|
|
|
|
## Notas para uso frecuente
|
|
|
|
- El script `run-jupyter-lab.sh` autodetecta puerto cada vez que se ejecuta
|
|
- El archivo `.jupyter-port` siempre tiene el puerto actual
|
|
- Si cambias de puerto, actualiza `.claude/settings.local.json` o recarga Claude
|
|
- Las reglas en `CLAUDE.md` se mantienen entre sesiones
|