问题描述
OCR如果想指定识别某区域文字,预处理和识别传入的参数应该是什么格式?
其他AI输入的原图是P888,三维形状CHW(3, 1080, 1920)
但是OCR检测预处理里返回的det形状却是四维(1, 113, 176, 3)这样,我理解的切片是如
cropped_np = img_p888_np[:, 0:540, 0:960]
这种的np切片,但是显然维度不同,没搞懂需要从什么数据源切片
而且我看识别模型里预处理
self.ai2d.build([1,3,ai2d_input_size[1],ai2d_input_size[0]],[1,3,self.model_input_size[1],self.model_input_size[0]])
形状都是1,3,长,宽,按照这样传入,前边的1,3是固定的吗?
但是传入的det形状(1, 113, 176, 3)顺序好像变了但是依旧可以识别别,
还有ai2d_output_shape必须是640*640效果才好吗,是宽*长
吗,改为其他大小也要保持正方形吗,
硬件板卡
庐山派
硬件板卡
庐山派
硬件板卡
庐山派
硬件板卡
庐山派