易语言资源网 - 做最全的易语言资源下载社区
精易论坛授权登录

simdjson目前最快的 JSON 解析   [复制链接]

    2019-03-18 10:48:58
    高级教程源码
    易语言资源网
    4063 次浏览
    来源链接


1. 封装了几个自定义的函数, 例如 move_to_root, array_get_length, array_move_to_index, 这样可以少调用一些 X64Call;

2. 简单实现了对于类似[0].A.B[0].C的路径的解析取值.

接下来说一下遇到的问题和一些体验:

1. 我构造的测试数据大小是大约是96MB, 在我的机器上可以正常解析, 再大一些(例如128MB)会崩溃, 崩溃位于ParsedJson.allocateCapacity, 琢磨了下没琢磨明白 (温馨提示: 真要是这种大小级别了还是建议各位用 SAX 方式);

2. 除了上面这点, 还有个已知的比较隐蔽 BUG, 貌似是print_这个函数的锅: 静态编译之后, 在 demo 中如果print_递归打印了一个Object例如[0], 再点击解析就会在iterator_free崩溃. 如果只是取值就不崩溃.

3. 这个库会拷贝数据, 在针对过长的数据的时候这不是好做法, 感觉这个库更像是科研性质, 和那些千锤百炼的老牌库相比, 目前可能只有速度占优势了;

4. 机器或者其它方面的限制, 我用易语言跑不出宣传文章中的千兆字节每秒, 不过几百 MB/s 还是有的;

5. 由于解析的时候它会拷贝数据, 我不清楚有没有可能会产生 64-bit 的内存地址, 暂时就是指针到文本当 32-bit 用, 但心里很没底, 希望 eWOW64Ext 作者有空可以帮忙看一下...@shier2817谢谢!

6. 库用的是 10.0.17134.0 版本的 SDK /MT 编译的, 但已经无法支持 WindowXP, 低版本的 SDK 编译不过去, 对这些指令不熟悉所以没有去探究原因(也许就是不支持, 详情请翻阅 MSDN);

7. 关于编译模式: 用 MinSizeRel 生成的话, 会导致 double 取值异常, 具体原因未深究, 所以默认使用了 Release . 我将会在附件中附上三种编译模式生成的文件供各位研究: RelWithDebInfo, MinSizeRel, Release;

用到的模块:

1. 感谢 eWOW64Ext :https://bbs.125.la/thread-14322538-1-1.html

2. Jβec :https://bbs.125.la/thread-14069145-1-1.html



点我下载 (已有 223 次下载)

引用模块


源码文件名 模块文件名
[new]simdjson.e
eWOW64Ext.ec
JB.ec


引用支持库


源码文件名 支持库文件名 支持库标识
[new]simdjson.e 系统核心支持库 5.3 d09f2340818511d396f6aaf844c7e325
特殊功能支持库 3.1 A512548E76954B6E92C21055517615B0


[错误报告]   上一篇:个人版记账系统v3.0源码...     下一篇:无限长度 十六进制 到 十进制 文本转换...