Skip to content

chu-shen/BangumiKomga

 
 

Repository files navigation

Bangumi metadata scraper for Komga

Introduction

This Script gets a list of every manga available on your Komga instance, looks it up one after another on Bangumi and gets the metadata for the specific series. This metadata then gets converted to be compatible to Komga and then gets sent to the server instance and added to the manga entry.

sample detail

Features

已完成

  • 为失败的系列创建收藏(可选)
  • 通知执行结果(可选)
  • 漫画系列添加元数据
  • 单册漫画添加元数据
  • 自动跳过已刷新元数据的条目
  • 系列及单册优先使用手动配置的 Bangumi 链接(cbl)
  • 配置 Bangumi 登录
  • 同步观看进度至 Bangumi
  • 可选择处理范围:①所有书籍系列;②指定库的书籍系列;③指定收藏的书籍系列
  • 区分单册和单话👉未匹配的书也会重新排序
  • 添加同人志👉推荐使用LANraragi
  • 可使用 Bangumi 图片替换系列、单册封面

处理逻辑见DESIGN

TODO

  • 使用bangumi/Archive离线数据代替联网查询
  • 限制联网查询频率
  • 提高 Bangumi 搜索结果匹配准确率,如:排序、评分
  • 更新 Komga 封面时,判断:类型('GENERATED')、大小
  • 重构元数据更新范围及覆盖逻辑
  • 增强文件名解析

Requirements

  • A Komga instance with access to the admin account
  • Either Windows/Linux/MAc or alternatively Docker
  • Python installed if using Windows, Linux or Mac natively

快速开始

Warning

Executing this program will result in the loss of old metadata for series and books
执行此程序将导致书籍系列及单册的旧元数据丢失

  1. Install the requirements using

    # prepare the environment on your own
    pip3 install -r install/requirements.txt
    
    # or use docker compose
    version: '3'
    services:
    bangumikomga:
        image: chu1shen/bangumikomga:main
        container_name: bangumikomga
        volumes:
        - /path/BangumiKomga/config.py:/app/config/config.py   # see step.2
        - /path/BangumiKomga/recordsRefreshed.db:/app/recordsRefreshed.db
        - /path/BangumiKomga/refreshMetadata.log:/app/refreshMetadata.log
  2. Rename config/config.template.py to config/config.py and edit the url, email and password to match the ones of your komga instance (User needs to have permission to edit the metadata).

    BANGUMI_ACCESS_TOKEN (可选)用于读取NSFW条目,在 https://next.bgm.tv/demo/access-token 创建个人令牌

    KOMGA_LIBRARY_LIST 处理指定库中的书籍系列。komga界面点击库(对应链接)即可获得,形如:'0B79XX3NP97K9',对应地址:http://IP:PORT/libraries/0B79XX3NP97K9/series。填写时以英文引号''包裹,英文逗号,分割。与KOMGA_COLLECTION_LIST不能同时使用

    KOMGA_COLLECTION_LIST 处理指定收藏中的书籍系列。komga界面点击收藏(对应链接)即可获得,形如:'0B79XX3NP97K9'。填写时以英文引号''包裹,英文逗号,分割。与KOMGA_LIBRARY_LIST不能同时使用

     Tips: 可以搭配`同步阅读进度`实现仅同步部分书籍系列的进度
    
  3. Run the script using python refreshMetadata.py, or docker start bangumikomga(The container automatically closes after execution.)

Tip

  • 如果漫画系列数量上千,请考虑使用bangumi/Archive离线数据代替联网查询
  • 可以搭配工具定时执行,比如ofelia

消息通知(可选)

消息通知支持Gotify、Webhook(如:飞书)、Healthchecks(定时任务监控)

  • NOTIF_TYPE_ENABLE: 启用的消息通知类型

  • Gotify

    • NOTIF_GOTIFY_ENDPOINT: Gotify base URL
    • NOTIF_GOTIFY_TOKEN: Application token
  • Webhook

    • NOTIF_WEBHOOK_ENDPOINT: URL of the HTTP request. 如飞书中创建自定义机器人时的 webhook 地址
  • Healthchecks

    • NOTIF_HEALTHCHECKS_ENDPOINT: URL of the HTTP request

创建失败收藏(可选)

CREATE_FAILED_COLLECTION配置为True,程序会在刷新完成后,将所有刷新失败的系列添加到指定收藏(默认名:FAILED_COLLECTION)。

每次运行都会根据本次运行数据重新创建此收藏(无失败则跳过)。

Tip

  • 在此收藏中按照如何修正错误元数据操作,启用RECHECK_FAILED_SERIES,然后填入cbl治疗强迫症
  • 如果要将所有失败的系列都添加至收藏,则需要将RECHECK_FAILED_SERIES配置为True

其他配置说明

  • RECHECK_FAILED_SERIES: 重新检查刷新元数据失败的系列

    • 建议搭配cbl使用
    • 其他情况下建议设置为False,可缩短程序运行时间
  • RECHECK_FAILED_BOOKS: 重新检查刷新元数据失败的书

    • 意义不明的参数,建议设置为False,可缩短程序运行时间
    • 如果刷新书时,bangumi 数据不完整,则可以在数据补充后使用此参数修正此书元数据
  • USE_BANGUMI_THUMBNAIL: 设置为True且未曾上传过系列海报时,使用 Bangumi 封面替换系列海报

    • 旧海报为 Komga 生成的缩略图,因此还可以通过调整Komga 服务器设置->缩略图尺寸(默认 300px,超大 1200px)来获得更清晰的封面
    • USE_BANGUMI_THUMBNAIL_FOR_BOOK: 设置为True且未曾上传过单册海报时,使用 Bangumi 封面替换单册海报

如何修正错误元数据

人工修正错误元数据可以使用cbl(Correct Bangumi Link),只需在系列元数据的链接中填入cbl和该漫画系列的 bangumi 地址。将强制使用此链接,不再进行刮削。

下面分三种情况说明具体操作:

  • 自此系列添加至 komga 后还未运行过此程序:

    • 填入上面提到的信息
    • 正常执行python refreshMetadata.py
  • 系列元数据更新失败,即「标题」与「排序标题」一样

    • 填入上面提到的信息
    • 如果未填写,也可以尝试使用最新版本重新匹配之前失败的系列
      • 只需将RECHECK_FAILED_SERIES配置为True,重新匹配失败的系列;将RECHECK_FAILED_BOOKS配置为True,重新匹配失败的单行本
    • 正常执行python refreshMetadata.py
  • 系列元数据更新错误,即匹配错误,刮削成其他条目:

    • 填入上面提到的信息
    • 不再需要记录 id,FORCE_REFRESH_LIST配置已被删除
    • 正常执行python refreshMetadata.py

为小说添加元数据

Komga 并没有区分漫画与小说。

可以尝试修改代码,使其只应用于 Komga 的小说库:将bangumiApi.py中的manga_metadata["platform"] != "小说"修改为manga_metadata["platform"] == "小说"

同步阅读进度

Warning

注意:当前仅为komga至bangumi单向同步,此功能未维护

Tip

推荐使用Tachiyomi更新阅读进度👉Tracking | Tachiyomi

同步内容:

  • 仅同步卷数,不同步话数
  1. 步骤同刷新元数据

  2. 步骤同刷新元数据

    注意:

    • 同步当前获取的所有系列的漫画进度(当前有3种范围:所有、仅指定库、仅指定收藏)。为避免污染时间线,请谨慎操作
  3. python updateReadProgress.py

命名建议

[漫画名称][作者][出版社][卷数][其他1][其他2]

  • [漫画名称]:以漫画封面实际名称为准,繁体不必转简体。

  • [作者]:作者名字亦以单行本所给名字为准

    • 繁体不转为简体,若有日文假名亦保留,如[島崎讓]、[天王寺きつね];
    • 若作者为多人,则以×&符号连接各作者(注意:不是英文x),将作画作者列于最后,如[矢立肇×有贺ヒトシ]、[手塚治虫×浦沢直树]、[堀田由美×小畑健]。
  • [出版社]:例如[玉皇朝]、[青文]。

  • [卷数]:例如[Vol.01-Vol.12]。

  • [其他1]、[其他2]:其他信息。例如[完结]、[来源]。

例如:

[碧蓝之海][井上堅二×吉岡公威][Vol.01-Vol.18]
[相合之物][浅野伦][Vol.01-Vol.13]
[海王但丁][皆川亮二×泉福朗][Vol.01-Vol.13][境外版]

命名建议修改自某喵

Issues & Pull Requests

欢迎提交新规则、问题、功能……

致谢

本项目部分代码及思路来自Pfuenzle/AnisearchKomga,部分代码生成自chatgpt,在此表示感谢!

语料库数据来源,感谢公开:

另外,也感谢以下优秀项目:

About

A Metadata Provider for Komga using Bangumi

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 99.3%
  • Dockerfile 0.7%