xin 项目一个“自用”的图片采集/发布/展示系统，从 0 到部署

TyrEamon

论我家的猫不会变成猫娘这档事明明一点也不科学！我家猫会后空翻(ฅ´ω`ฅ) ------------------------------------------------ Curated, as you see | : )

文章数

7

总字数

0.7w

访问量

0

访客数

0

1232 字

6 分钟

xin 项目一个“自用”的图片采集/发布/展示系统，从 0 到部署

个人插画收藏的全链路系统：后端使用Go，自动同步，图&链监听，元数据写入 Cloudflare D1，支持 OpenList(WebDAV/OneDrive) 异步备份。前端提供图库展示、随机图 API、收藏与筛选，后台支持上传、隐藏黑名单、喜欢列表和运行状态查看。

2026-02-21

0 次

0 人

该项目是为了更好的收集和展示个人收藏的图片而设计的，自用。本项目可以部署在本地或云端，推荐在云端部署。

0. 先说结论：xin 到底在干嘛#

xin 本质是一个 Go 后端 + 静态前端 的图站方案：

图来源：轮询爬取pixiv及twitter的收藏、TG 上传、TG 链接监听（Pixiv / Yande / FANBOX / Twitter / 或其他图站[得自己加逻辑]）
图存储：
- 发布频道 A：放预览图（给前台看）
- 存储频道 B：放原图（留档 + 按钮获取）
建议给 A 频道绑定讨论组，用于评论区挂原图/详情按钮
元数据：Cloudflare D1
可选备份：WebDAV / OpenList

关键设计：前台只吃预览图，原图走 B 频道，前端更稳，带宽压力也更小。

系统架构一览：Pixiv/TG -> Go 后端 -> A/B 频道 + D1 + WebDAV

1. 前置条件（不满足就别往下）#

先确认你有这些东西：

一个 Telegram Bot（拿到 BOT_TOKEN）
两个 Telegram 频道：A（发布）+ B（存储）
（可选）A 绑定的讨论组（用于评论区挂原图/详情按钮）
Cloudflare D1（已有数据库 ID）
我这里使用的是Zeabur（部署后端容器），建议使用线路好的个人主机或者容器
Cloudflare Pages / EdgeOne（部署静态前端）

1.1 TG 权限#

机器人必须是 A、B 两个频道管理员；要用讨论区就让机器人在讨论组也能发消息。

2. 建立D1数据库表#

你有两种方式：

你可以直接跑项目里的 schema.sql（推荐）
让后端首次启动自动补齐（更省事，但建议后面手动核对）

如果你是旧库升级，至少确认这些表存在：

images
favorites
ingest_blocklist
crawler_state
（开备份）image_backups

快速检查表：

1
SELECT name FROM sqlite_master WHERE type='table' ORDER BY name;

3. Zeabur 部署后端（最小可用）#

3.1 必填环境变量#

最小集合（先跑起来）：

1
BOT_TOKEN=
2
PUBLISH_CHANNEL_ID=
3
STORAGE_CHANNEL_ID=
4
# 可选：DISCUSSION_GROUP_ID=
5

6
CLOUDFLARE_ACCOUNT_ID=
7
CLOUDFLARE_API_TOKEN=
8
D1_DATABASE_ID=
9

10
ADMIN_PASSWORD=

3.2 Pixiv 相关配置（看个人需求，要自动爬就配）#

1
PIXIV_PHPSESSID=
2
PIXIV_USER_ID=
3
PIXIV_TAG=
4
PIXIV_REST=show
5
PIXIV_CRAWL_ORDER=desc
6
PIXIV_LIMIT=40
7
PIXIV_MAX_PAGES=0
8
PIXIV_BOOTSTRAP_MAX_PAGES=-1
9
PIXIV_INCREMENTAL_MAX_PAGES=2
10
PIXIV_INTERVAL_MINUTES=120

经验值：全量完成后，把状态切到增量，不然每轮从头扫会很慢。

3.3 一眼看启动是否正常#

看日志是否有：

HTTP server listening on :8080
Pixiv crawl started ...（你配了 Pixiv 时）

4. 前端部署（Pages/EdgeOne）#

前端是静态页，和后端分开部署。也可以不去部署web，因为后端部署上去就包括前端。访问后端域名，通常都能重定向到/gallery.html。

后端域名示例：https://a.example.com
前端域名示例：https://b.example.com/gallery.html

前端请求后端 API，只要 API 域名填对即可。

5. 先做 5 分钟验收（别一上来就全链路压测）#

按顺序测：

给 Bot 发一张图
- A 有预览
- B 有原图
- D1 有新记录
给 Bot 发一条 Pixiv 链接
- 正常入库 + 前台可见
打开后台上传页上传一张图
- 成功后前台能看到
（开了备份）看备份健康状态

备份检查（可选，你可以在管理面板查看备份情况）：

1
$base = "https://你的后端域名"
2
$auth = "x:你的ADMIN_PASSWORD"
3
curl.exe -sS -u $auth "$base/admin/api/backup/health?probe=1"

6. 常见坑（按报错关键字定位）#

6.1 `getUpdates ... 409 Conflict`#

含义：同一个 Bot 有多个实例在轮询。
处理：保证只有一个服务在跑（关掉旧实例、重复服务）。

6.2 `ghcr.io ... 401 Unauthorized`#

含义：拉镜像没权限。
处理：检查包是否 public，或给 Zeabur 配 GHCR 拉取凭证。

6.3 `chat not found`#

含义：机器人不在目标频道，或频道 ID 配错。
处理：确认 Bot 在 A/B 频道里、ID 前缀 -100 没写错。

6.4 `context deadline exceeded`#

含义：网络链路超时（TG / 目标站 / 容器出口波动）。
处理顺序：

容器里 wget 测目标 URL 连通性
降低并发/缩小单次抓取量
把 TG 直传改成 file_id 直发

6.5 `pixiv bookmarks error: cannot unmarshal ... id`#

含义：上游返回结构变了。
处理：更新解析逻辑，别硬写死字段类型。

7. 我建议的“稳定参数”起步值#

用的是go语言轻量、高并发，对配置要求不高。反倒看重线路的质量。：

Pixiv：PIXIV_INTERVAL_MINUTES=120
Pixiv 增量：PIXIV_INCREMENTAL_MAX_PAGES=2
Twitter 作者轮询：TWITTER_AUTHOR_INTERVAL_MINUTES=120
作者抓取数：TWITTER_AUTHOR_FETCH_LIMIT=3~5
备份：BACKUP_WORKERS=1

先稳住，再提速。

8. 你要能复述的原理（核心三句话）#

前台看的是预览图，不是原图，原图放 B 频道。
D1 只管索引和状态，图文件本体不进 D1。
超时大头通常在“下载再上传”，file_id 直发能明显减压。

日志对照图

如果你照着做卡住了，优先把这 3 个信息贴出来再排：

报错原文（完整一段）
相关环境变量名（值可打码）
你当前访问链路（前端域名、后端域名、有没有 Worker/CDN）

这样定位会很快，不用盲猜。

这篇文章是否对你有帮助？

联系

xin 项目一个“自用”的图片采集/发布/展示系统，从 0 到部署

作者

TyrEamon

发布于

2026-02-21

许可协议

CC BY-NC-SA 4.0

Alist/OpenList 美化教程：自定义头部快速上手（背景/毛玻璃/切换按钮）

Pixiv 收藏本地下载器（Python）随手记

1
0. 先说结论：xin 到底在干嘛
2
1. 前置条件（不满足就别往下）
- 1.1 TG 权限
3
2. 建立D1数据库表
4
3. Zeabur 部署后端（最小可用）
5
4. 前端部署（Pages/EdgeOne）
6
5. 先做 5 分钟验收（别一上来就全链路压测）
7
6. 常见坑（按报错关键字定位）
8
7. 我建议的“稳定参数”起步值
9
8. 你要能复述的原理（核心三句话）

0. 先说结论：xin 到底在干嘛#

1. 前置条件（不满足就别往下）#

1.1 TG 权限#

2. 建立D1数据库表#

3. Zeabur 部署后端（最小可用）#

3.1 必填环境变量#

3.2 Pixiv 相关配置（看个人需求，要自动爬就配）#

3.3 一眼看启动是否正常#

4. 前端部署（Pages/EdgeOne）#

5. 先做 5 分钟验收（别一上来就全链路压测）#

6. 常见坑（按报错关键字定位）#

6.1 getUpdates ... 409 Conflict#

6.2 ghcr.io ... 401 Unauthorized#

6.3 chat not found#

6.4 context deadline exceeded#

6.5 pixiv bookmarks error: cannot unmarshal ... id#

7. 我建议的“稳定参数”起步值#

8. 你要能复述的原理（核心三句话）#

6.1 `getUpdates ... 409 Conflict`#

6.2 `ghcr.io ... 401 Unauthorized`#

6.3 `chat not found`#

6.4 `context deadline exceeded`#

6.5 `pixiv bookmarks error: cannot unmarshal ... id`#