Skip to content

Navigation Menu

Sign in
Appearance settings

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up
Appearance settings
/ - Public
forked from JY0284/zizhitongjian

资治通鉴,文言文/白话文对照文本,便于阅读。数据建模、可视化进行中。文白对照阅读:https://jy0284.github.io/zizhitongjian/

License

Notifications You must be signed in to change notification settings

zxw584/-

Repository files navigation

资治通鉴-文白对照数据-人工智能辅助理解

文白对照阅读

阅读书籍点击

简介

项目地址:zizhitongjian

这个仓库是有关资治通鉴-文白对照的可供人类和机器阅读阅读并进行相关数据研究的项目。

本项目中的文本格式按照原书的进行整理,chapters目录下按照[0-9]+_资治通鉴卷名.md进行分别存储:

chapters
├── 001_资治通鉴第一卷(周纪).md
├── 002_资治通鉴第二卷(周纪).md
├── 003_资治通鉴第三卷(周纪).md
...

每一卷的内容格式如下(*表示在部分卷中可能不存在的内容):

[卷名]*
[时间原文]
[时间译文]
[空白][空白][原文]
[空白][空白][译文]
[空白][空白][原文]
[空白][空白][译文]
[时间原文]
[时间译文]
[空白][空白][原文]
[空白][空白][译文]

结构化数据

结构化数据已由model.py生成,其中的数据结构及生成过程可见于model.py。结构化数据保存于data.json(结构化数据文件)。数据读取和使用样例请见data_usage_demo_visualization.ipynb(结构化数据使用样例)。

抛砖引玉——资治通鉴数据应用样例(壹):AI辅助理解可视化

正在进行中。(结构化数据使用样例)

正在进行中的可视化Demo(使用GPT-O1与Deepseek-R1完成): demo_1 demo_2 demo_3

项目进展

项目在持续更新,目前任务列表完成情况如下:

  • 文本内容获取
  • 格式化卷名,便于排序及查询
  • 时间数据的译文格式保持和原文格式统一
  • 去除不符合文白对照格式的空行、空格,使用统一的换行格式
  • 文本内容程序化校对,定位残缺和错误内容
  • 文本数据结构化,便于利用数据分析工具和可视化工具进行处理
  • 结构化数据使用样例
  • AI辅助理解及可视化样例
  • AI辅助获取全书知识图谱(人物、事件及其关系)
  • 对话交互式资治通鉴
  • ...

数据预处理的部分源码及说明在本项目的*.ipynb中存档及更新。

如果有任何感兴趣的、想要这个项目做的,请随时、尽情建议!

参与贡献

  1. 请随时、尽情在issue中提供任何意见建议,不限于文本内容、文本格式、数据结构、数据分析、数据可视化等任何主题;
  2. 文本中有[todo]的地方为分析过程中发现的内容残缺的部分,可以参与校对和修复:D

相关资源

  1. http://www.ziyexing.com/files-5/zizhitongjian/zizhitongjian_index.htm
  2. https://ctext.org/wiki.pl?if=gb&res=548761&remap=gb
  3. 卷28译文可参考:http://www.ziyexing.com/files-4/yywj-157.htm

Star History

Star History Chart

About

资治通鉴,文言文/白话文对照文本,便于阅读。数据建模、可视化进行中。文白对照阅读:https://jy0284.github.io/zizhitongjian/

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 95.4%
  • Python 4.6%

AltStyle によって変換されたページ (->オリジナル) /