Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

请问有什么可以帮忙的地方吗 #20

Open
aboutx opened this issue Apr 20, 2022 · 20 comments
Open

请问有什么可以帮忙的地方吗 #20

aboutx opened this issue Apr 20, 2022 · 20 comments

Comments

@aboutx
Copy link

aboutx commented Apr 20, 2022

图像分类,python/C++编程等方面

@bigbrother666sh
Copy link
Contributor

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论
@jackw1997

@2562789632
Copy link

能不能维护一个to do list,更新现在还有那些任务需要完成,这样方便大家帮忙

@yuriten
Copy link

yuriten commented Apr 20, 2022

同问,希望有机会可以帮助到你们,贡献一份力。个人可以提供编程帮助

@wj-Mcat wj-Mcat pinned this issue Apr 20, 2022
@wj-Mcat
Copy link
Collaborator

wj-Mcat commented Apr 20, 2022

@2562789632 @LinkDuang 非常高兴你们能够有兴趣参与到这个项目中来,由于目前还处于初期落地和推广,基本功能已经实现,后期如果有更加复杂的功能,比如:OCR、Conversation AI Chatbo等,我们也会开放出任务计划,欢迎各位前来贡献自己的一份力量。

另外,我们这边有一个功能愿望清单: #25 ,大家可以自行填写或者邀请身边的人填写对于此项目的期待功能,有价值的功能我们也会进行会议讨论来决定是否纳入到功能列表中来。

@wj-Mcat wj-Mcat unpinned this issue Apr 20, 2022
@aboutx
Copy link
Author

aboutx commented Apr 21, 2022

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

意思是一张图里可能有几个抗原检测盒,需要对每个盒子的结果进行识别吗?
按说应该是只有一个盒子吧,这种情况的话训练一个图像二分类器出初步结果,然后加一个人工纠错机制应该就能用
如果有多个盒子那就得再加个物体检测框架了
要保证准确率的话,最好还是像照身份证那样,要求直接把盒子拍在正中央,后端对图像进行分类

@aboutx
Copy link
Author

aboutx commented Apr 21, 2022

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

@bigbrother666sh
Copy link
Contributor

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

嗯,稍微增加一点用户侧的限制确实可以,比如要求单张照片只有一个盒子,且在中央,……
训练的话,你那有算力资源么?

@aboutx
Copy link
Author

aboutx commented Apr 21, 2022

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

嗯,稍微增加一点用户侧的限制确实可以,比如要求单张照片只有一个盒子,且在中央,…… 训练的话,你那有算力资源么我

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

嗯,稍微增加一点用户侧的限制确实可以,比如要求单张照片只有一个盒子,且在中央,…… 训练的话,你那有算力资源么?

训练可以我来。接口的话就是传入图片,输出01。但是部署的话你们服务器性能怎么样?在磁盘网络等硬件不成为瓶颈的情况下,一块1080TI每秒可以支持对90张左右的448*448图片进行测试(如果算力不够的话可以考虑降分辨率或者换骨干网络)
可以考虑先用五百张带标签的脱敏图片(两种情况各一半)训一下试试,因为我也不清楚具体需要多少张图片才能达到不错的效果
如果要在手机端部署的话那就触及到我知识盲区了,得现学一下..

@aboutx
Copy link
Author

aboutx commented Apr 21, 2022

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

嗯,稍微增加一点用户侧的限制确实可以,比如要求单张照片只有一个盒子,且在中央,…… 训练的话,你那有算力资源么?

五百张图片的数目主要是因为PASCAL VOC2007是一个包含5000张训练图片的多标签图像分类数据集,一共20个类别。用ResNet-101+MLP的方式可以在VOC上达到93、4的mAP。所以我估计五百张就差不多了

@bigbrother666sh
Copy link
Contributor

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

嗯,稍微增加一点用户侧的限制确实可以,比如要求单张照片只有一个盒子,且在中央,…… 训练的话,你那有算力资源么?

五百张图片的数目主要是因为PASCAL VOC2007是一个包含5000张训练图片的多标签图像分类数据集,一共20个类别。用ResNet-101+MLP的方式可以在VOC上达到93、4的mAP。所以我估计五百张就差不多了

我们这里现成的应该只有一张1080(8G),估计不太够,可能真的部署的时候需要去租个云cpu。或者你熟悉百度飞桨框架?
百度飞桨上我有个账号能够送点时长,我也可以试着找飞桨运营申请支持,乐观估计上海也就再封一个月……吧
(我记得飞桨训练阶段是不要钱的,可以用V100)

@bigbrother666sh
Copy link
Contributor

能不能维护一个to do list,更新现在还有那些任务需要完成,这样方便大家帮忙

@LinkDuang @2562789632

感谢二位的关注,我来简单说一下现在的情况。
目前这个项目有两个产品线在维护,一个是本项目(antigenwechatbot),基于python-wechaty的对话机器人,具体介绍都在readme上,另一个是能够按小区楼栋分布自动计算最佳配送路径的项目,https://github.com/ShanghaiITVolunteer/JuWeiHui;

所以简单的说,二位有兴趣的话,可以考虑从三个方面加入我们:
1、参与antigenwechatbot的开发,但这个需要先去熟悉下python-wechaty(https://github.com/wechaty/python-wechaty)
2、参与 https://github.com/ShanghaiITVolunteer/JuWeiHui 据我所知,那边很缺人,并且用户呼声很高
3、参与新功能模块,比如上面讨论的抗原自动检测。另外如果二位熟悉ASR,我们其实有另一个模块一直想做,即可以把语音(很大概率是上海话)转成文本,这主要是照顾特殊群体,比如老人。另外还有更加智能的中英翻译,以便照顾外籍人士(二位有兴趣,可以搜下这两天被困在疫情中的老外的段子,很多,不是为了搞笑,确实他们现在是弱势群体)。另外还有,TTS,我设想过,机器人可以把一些播报以甜美女生的声音发送,应该会有振奋人心的作用……

我的建议是尽量选择你们熟悉且有资源的领域,因为本项目的特殊性,一切都是志愿行为……且我们时间很紧迫……
期待着两位以及其他更多人的加入……

@bigbrother666sh
Copy link
Contributor

@LinkDuang @2562789632 两位如果感兴趣参与antigenwechatbot的话,
在熟悉了python-wechaty基础上,可以考虑从这个功能开始。#16

@aboutx
Copy link
Author

aboutx commented Apr 22, 2022

能不能维护一个to do list,更新现在还有那些任务需要完成,这样方便大家帮忙

@LinkDuang @2562789632

感谢二位的关注,我来简单说一下现在的情况。 目前这个项目有两个产品线在维护,一个是本项目(antigenwechatbot),基于python-wechaty的对话机器人,具体介绍都在readme上,另一个是能够按小区楼栋分布自动计算最佳配送路径的项目,https://github.com/ShanghaiITVolunteer/JuWeiHui;

所以简单的说,二位有兴趣的话,可以考虑从三个方面加入我们: 1、参与antigenwechatbot的开发,但这个需要先去熟悉下python-wechaty(https://github.com/wechaty/python-wechaty) 2、参与 https://github.com/ShanghaiITVolunteer/JuWeiHui 据我所知,那边很缺人,并且用户呼声很高 3、参与新功能模块,比如上面讨论的抗原自动检测。另外如果二位熟悉ASR,我们其实有另一个模块一直想做,即可以把语音(很大概率是上海话)转成文本,这主要是照顾特殊群体,比如老人。另外还有更加智能的中英翻译,以便照顾外籍人士(二位有兴趣,可以搜下这两天被困在疫情中的老外的段子,很多,不是为了搞笑,确实他们现在是弱势群体)。另外还有,TTS,我设想过,机器人可以把一些播报以甜美女生的声音发送,应该会有振奋人心的作用……

我的建议是尽量选择你们熟悉且有资源的领域,因为本项目的特殊性,一切都是志愿行为……且我们时间很紧迫…… 期待着两位以及其他更多人的加入……

我最近正好在做语音..语音识别用百度的deepspeech(https://github.com/mozilla/DeepSpeech)直接调用接口就行,普通话效果还可以。上海话就不清楚了...

@aboutx
Copy link
Author

aboutx commented Apr 22, 2022

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

嗯,稍微增加一点用户侧的限制确实可以,比如要求单张照片只有一个盒子,且在中央,…… 训练的话,你那有算力资源么?

五百张图片的数目主要是因为PASCAL VOC2007是一个包含5000张训练图片的多标签图像分类数据集,一共20个类别。用ResNet-101+MLP的方式可以在VOC上达到93、4的mAP。所以我估计五百张就差不多了

我们这里现成的应该只有一张1080(8G),估计不太够,可能真的部署的时候需要去租个云cpu。或者你熟悉百度飞桨框架? 百度飞桨上我有个账号能够送点时长,我也可以试着找飞桨运营申请支持,乐观估计上海也就再封一个月……吧 (我记得飞桨训练阶段是不要钱的,可以用V100)

并发量峰值估计多少呀,1080TI每秒90张图片其实是有很大提升空间的。降点分辨率换个骨架网络提升十几倍没问题。
纯推理模型的话也可以通过推理模型加速。
另外想了解一下抗原识别功能的期望上线时间

@bigbrother666sh
Copy link
Contributor

所有的功能都是越快越好,现在可以用,现在上线也行。
asr部分,你能做些测试么?

@aboutx
Copy link
Author

aboutx commented Apr 23, 2022

所有的功能都是越快越好,现在可以用,现在上线也行。 asr部分,你能做些测试么?
离线测试的话,数据发到[email protected]

@aboutx
Copy link
Author

aboutx commented Apr 23, 2022

所有的功能都是越快越好,现在可以用,现在上线也行。 asr部分,你能做些测试么?
百度的deepspeech是直接Pip install之后调用接口就可以了,所以我不太明白你需要我做什么

@jackw1997
Copy link
Contributor

图像分类,python/C++编程等方面

现在确实有一个cv方面的需求,即自动根据居民上传的图片职别抗原监测结果(一道杠还是两道杠),然后能够识别出一张图里面有几个抗原监测盒,这方面不知道你有什么思路么?欢迎与我们讨论 @jackw1997

如果杠的显示清晰的话,那么网络结构用预训练的ResNet-101接MLP,有几百张图片训练效果应该就挺不错了。不过我没有做过工程类的项目,可能对Corner case支持不好,最好是机器初筛+人工审核异议

嗯,稍微增加一点用户侧的限制确实可以,比如要求单张照片只有一个盒子,且在中央,…… 训练的话,你那有算力资源么?

五百张图片的数目主要是因为PASCAL VOC2007是一个包含5000张训练图片的多标签图像分类数据集,一共20个类别。用ResNet-101+MLP的方式可以在VOC上达到93、4的mAP。所以我估计五百张就差不多了

我们这里现成的应该只有一张1080(8G),估计不太够,可能真的部署的时候需要去租个云cpu。或者你熟悉百度飞桨框架? 百度飞桨上我有个账号能够送点时长,我也可以试着找飞桨运营申请支持,乐观估计上海也就再封一个月……吧 (我记得飞桨训练阶段是不要钱的,可以用V100)

并发量峰值估计多少呀,1080TI每秒90张图片其实是有很大提升空间的。降点分辨率换个骨架网络提升十几倍没问题。 纯推理模型的话也可以通过推理模型加速。 另外想了解一下抗原识别功能的期望上线时间

这里样本bias严重啊,阳性抗原结果极少,几百张图甚至可能只有个位数的阳性结果,你确定能算出来嘛?
我之前处理过类似数据集,即使通过各种trick扩充数据集,效果仍然不是很好。尤其是这种时候一次误判可能就会有较大的负面影响。
当然还有法律风险,是否主动收集抗原结果会有隐私伦理问题。
欢迎加一下我的微信wgzjack0305讨论吧。以及我们有些别的项目如果愿意的话也可以来帮忙

@jackw1997
Copy link
Contributor

@aboutx 如果能在实际做法上达成一致的话,我觉得算力资源反而是不用担心的。愿意帮忙的人很多,可以发动人民战争的力量,每几个愿意帮忙的人家里总归加起来至少有一块显卡吧,借一借凑一凑总归够的(不过就是还要设计个分布式系统罢了,但我有个好基友就是这个方向的大佬,我可以去舔一舔)

@bigbrother666sh
Copy link
Contributor

@aboutx 如果能在实际做法上达成一致的话,我觉得算力资源反而是不用担心的。愿意帮忙的人很多,可以发动人民战争的力量,每几个愿意帮忙的人家里总归加起来至少有一块显卡吧,借一借凑一凑总归够的(不过就是还要设计个分布式系统罢了,但我有个好基友就是这个方向的大佬,我可以去舔一舔)

这不用担心,京京说飞桨他认识人,能够提供算力支持,而且确实飞桨有这个政策

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

6 participants