人工输入的数据有没有办法变成excel可编辑电子版

@Ta 08-23 10:24 11279点击
现在有几万个纸档数据,有没有办法通过扫描或者其他方法变成可编辑的excel电子档?工具有手机拍照或扫描仪,可以导出pdf,各种图像格式

已经测试过的软件或方法:
1、扫描全能王VIP,这个成功率最好,但有很多错误的,需要一个一个核对,数据量太多没有意义。
2、布丁扫描,识别率比较差,没多少能成功的。
3、QQ截图识别,哔哩哔哩上推荐的,效果也不尽如意。
4、常见的几个在线pdf转excel网站,基本得到的就是一张扫描照片或空白excel。
5、福昕pdf编辑器,转换成excel里面加图片。
6、Power Bi,网上说可以转成pdf识别,我试了直接空白。

还有没有其他方法?附件大家可以试一下
尺寸数据.pdf(66.88 KB)
回复列表(28|隐藏机器人聊天)
  • @Ta / 08-23 11:46 / /
    要想数据准确,恐怕只能花钱外包真“人工”智能。识别的100%需要校对
  • @Ta / 08-23 11:47 / /

    @hui214,这个有帮助吗:PaddleOCR

    看起来能识别很多形式的东西。。
    out.webp(144.53 KB)

  • @Ta / 08-23 12:01 / /
    @无名啊,这个没试过
  • @Ta / 08-23 12:21 / /

    WPS AI 识别不到手写数据
    wechat_2024-08-23_122114_629.png(586.17 KB)

  • @Ta / 08-23 12:52 / /
    @无名啊,这个使用起来也比较麻烦
  • @Ta / 08-23 12:53 / /
    @老虎会游泳,这个图片亮度可以用布丁扫描处理一下的
  • @Ta / 08-23 13:23 / /

    @hui214,亮起的地方是识别到文字了,暗的地方是没识别到。截图说明大部分手写数据都没识别到。

  • @Ta / 08-23 13:26 / /
    @hui214,你自己用Python训练一个AI就行了
  • @Ta / 08-23 14:05 / /
    主要是拍照导出的 PDF,本质内容就是一张图片,只能走 OCR 提取,市面上的 PDF 转 Excel,大部分都是要 PDF 含有文字内容的才能识别到,逻辑是通过解析 PDF 内容去提取,就像 Word 里面放表格跟放表格图片的区别一样,放了表格的就能读到,放了图片肯定读不出来。

    尝试下百度的 OCR 或者看看 AI 能不能处理,理论上这俩能识别,但是还需要人工校对一遍(校对可以骚操作,两截图 diff 一下,业界有图片比对的软件)。

    基本上这样能保证大部分数据可用了,但是 100% 可用就不能保证了。
  • @Ta / 08-23 22:52 / /
    @李沐沐,没搞过,不知道怎么训练,有没有教程?
    @无名啊,安装以后有些下载很慢或下载错误,就没办法使用了,吾爱破解上面的也找了几个,都没什么效果
    @hello_新,能识别80%以上手工核对都无所谓,基本识别都差异比较大,没几个成功的。
  • @Ta / 08-24 12:16 / /
    使用Rapid🗲OCR Demo也不行,截取一小部分也一样
    12.png(513.44 KB)
  • hik
    @Ta / 08-24 13:41 / /

    手写的不行

  • @Ta / 08-24 14:58 / /
    用百度的https://ai.baidu.com/tech/ocr_others/handwriting ,但是你要的功能很难实现,json还有进行转换,python可以实现识别、转换,但是不能保证手写识别准确率的。
  • @Ta / 08-24 18:48 / /
    @森森,这个效果看起来更好,但数据有很多错误的,数值也不好匹配。image.png(1.1 MB)
  • @Ta / 08-25 02:29 / /
    找一个大学生
  • @Ta / 08-25 08:07 / /
    近年来,随着科技的发展,智能笔和纸笔互动系统已经开始在教育领域得到应用。这些系统通常包括一支特殊的智能笔和与之配套的纸张。学生在纸上书写时,智能笔可以实时采集书写内容、速度和时长等信息,并将其传输到电子设备上,如老师的电脑或教室的大屏幕。
    例如,佳能公司推出了一种智慧点阵打印解决方案,其中包括纸笔交互功能,可以提升作业效率和课堂互动。深圳市凝趣科技有限公司也提供了一种智能点阵笔Qpen,作为智慧教育书写解决方案的一部分。
    然而,这种技术的应用也引发了一些争议。有报道指出,某些学校使用智能笔监控学生的作业完成情况,这引起了关于学生隐私和监控边界的讨论。一些专家和学者指出,虽然智能学习产品可以作为辅助工具,但过度使用可能会形成教育的“笼子”,并对学生的个人隐私构成威胁。
    在常态化教学场景下,智能纸笔互动系统的目的是融合传统书写习惯和现代技术,以改善教学效率和互动性。但这种系统的发展和普及需要考虑到教育公平、学生隐私保护等因素,确保技术的合理和适度使用。
    综上所述,智能笔和纸笔互动系统在教育领域的应用前景广阔,但同时也需要关注和解决隐私保护等潜在问题。
  • @Ta / 08-25 20:02 / /
    @tasy5kg,我们这里招了3个大学生
  • @Ta / 08-27 14:54 / /
    我记得有专业数据扫描上传的机器,我在电网看见过!很快准确率很高!
  • @Ta / 08-27 14:56 / /
    在档案室我也见过,专业做数字化保存那个扫描机,不知道叫啥!
添加新回复
回复需要登录