Skip to content

android ios macos linux windows webassembly 预编译库 20211122 e4c821a

Compare
Choose a tag to compare
@github-actions github-actions released this 22 Nov 10:01
e4c821a

编译版本,默认配置,android-ndk-r21d,xcode 12.4,ubuntu-18.04,ubuntu-20.04,vs2015,vs2017,vs2019,emscripten-2.0.8

file content arch
ncnn-full-source.zip 包含全部 submodule 代码的完整源码
ncnn-android.zip android 静态库/动态库 armeabi-v7a + arm64-v8a + x86 + x86_64
ncnn-android-vulkan.zip android 静态库/动态库,支持 GPU armeabi-v7a + arm64-v8a + x86 + x86_64
ncnn-ios.zip ios 静态库,with and w/o bitcode armv7 + arm64 + arm64e + i386 + x86_64
ncnn-ios-vulkan.zip ios 静态库,支持 GPU,with and w/o bitcode arm64 + arm64e + x86_64
ncnn-macos.zip macos 静态库 x86_64 + arm64
ncnn-macos-vulkan.zip macos 静态库,支持 GPU x86_64 + arm64
ncnn-ubuntu.zip ubuntu linux 静态库/动态库,支持 GPU,模型转换工具 x86_64
ncnn-windows.zip windows 静态库/动态库,支持 GPU,模型转换工具 x86 + x86_64
ncnn-webassembly.zip webassembly 静态库 wasm32 + simd + threads + simd-threads

PNNX(PyTorch Neural Network Exchange)是PyTorch模型部署的新方式,可以避开ONNX中间商,导出比较干净的高层OP
risc-v v binaryop, hardswish, hardsigmoid, prelu, selu, dropout, gru, softmax优化(thelastlin)
risc-v v conv1x1 fc优化
arm neon requantize leakyrelu优化
arm neon innerproduct gemm int8优化
针对c906 sgemm pack优化(yaobyPerfxlab, xianyi)
x86 avx 卷积激活优化(zhiliu6)
x86 sse convolution, convolutiondepthwise, pooling优化(Timen)
修正layernorm affine计算错误
修正pooling adaptive计算错误
修正deconvolution output padding在有bias时的计算错误
interp支持cubic aligncorner插值
interp支持对2维数据w方向拉伸
新增convolutiondepthwise1d和pnnx转换
rnn/lstm/gru支持不相等的输入输出个数
修正squeeze和expanddims层axes的处理
使用整数计算pooling adaptive参数上下界(Yutyrannus)
修复armv7 neon round模式差异
修复x86 sse/avx round模式差异
修复int8输入单元测试可能的越界读
修复在某些android平台无法获得auxv变量的问题
修正apple a11 a12检测armv8.2 dot扩展指令错误的问题
内存引用加载模型时不再拷贝到内存
修复pyncnn numpy转Mat时非对齐拷贝出错的问题
正确检测和支持apple a15和m1(zchrissirhcz)
修复AVX-only代码和用户提供opt时的单元测试逻辑(Timen)
hardswish激活合并入convolution和innerproduct(zhiliu6)
自动解耦extract的Mat数据与Net实例的内存池
Net的custom_layer_to_index移到public(Timen)
删除代码中的无用变量(Sinky-Yan)
cmake检测esp32的xtensa架构
cmake install安装ncnn工具(jinmingyi1998)
修正hardswish test beta参数(zhiliu6)
修复ncnnoptimize无法生成合理int8权重的问题
ncnnoptimize支持embd层
修正onnx2ncnn concat算子负数axis转换的问题
修复onnx2ncnn合并expand算子(grimoire)
修复某些arm kernel越界读数据的问题
修复NCNN_STDIO=OFF的编译问题
新增YOLOX例子, 更新预处理逻辑(FateScript)
新增RobustVideoMatting例子(FeiGeChuanShu)
新增scrfd croudhuman例子(MarsTechHAN)
新增YOLOv5 v6.0例子(zhiliu6)
新增CrowdCounting-P2PNet例子(FeiGeChuanShu)
readme添加yolox(Sinky-Yan)
更新readme文档(fzyzcjy)
修复msvc编译器警告(TianZerL)
一些拼写错误修正(cmdbug, huoshuai-dot)
更新faq文档(ncnnnnn, luqiang-guo, zhiqwang, cmdbug, CharlesHuan, Shiro-Nana, zmq175)
更新operators算子文档(soragotosann)
更新d1和ls2k编译文档
新增termux编译文档(Sinky-Yan)
更新msvc编译文档(ncnnnnn)
更新编译文档(dankernel, mlbo, xiguadong)
更新macos openmp安装方法(zhiqwang)
更新量化文档中的链接(ShiquanYu)
修正python编译文档路径错误(nixondutt)
benchmark新增m1数据(zhiqwang)
benchmark新增mbp数据(AnnYellow)
benchmark新增khadas vim3 amlogic a311d数据(elejke, FeiGeChuanShu)
benchmark新增Phytium FT-2000+/64数据
benchmark新增RK3568数据(BowShotDS)
benchmark新增RK3328数据(Liuyufanlyf)
benchmark新增Ingenic X2000和T40数据(MarsTechHAN)
ci更新swiftshader
ci新增基于lavapipe的gpu测试
ci删除travis arm32(Richuanwu)
ci更新xcode版本

New Contributors

Full Changelog: 2021072...2021112