摄像系统以及图像识别系统的利记博彩app

文档序号:9930043阅读:330来源:国知局
摄像系统以及图像识别系统的利记博彩app
【技术领域】
[0001] 本发明设及计算机及计算机应用技术领域,特别设及一种摄像系统W及图像识别 系统。
【背景技术】
[0002] 通常来说,一台计算机主要包括S个核屯、部分:中央处理器(CPU, Central Processing Unit)、内存和存储。
[0003] 经过一些世界顶级公司的不懈努力,CPU已经演变成极度复杂的半导体忍片。顶 级的CPU内核内部的MOS管数目可W超过一亿个。目前的产业趋势是受制于功耗,CPU的 运行频率已经很难再提高。已经极度复杂的现代CPU,运行效率同样很难再提高。新的CPU 产品,越来越多地朝多核方向演进。
[0004] 在内存方面,目前居于统治地位的是动态随机存取存储器值RAM,Dynamic Random Access Memory)技术。DRAM可W快速随机读写,但却不能在断电的情况下保持内容。实际 上,即使在通电的情况下,它也会由于内部用于储存信息的电容器的漏电而丢失信息,必须 周期性地自刷新。 阳0化]在存储方面,NAND闪存技术正在逐步取代传统硬盘。闪存所依赖的浮置栅极 (floating gate)技术,虽然能够在断电的情况下保持内容,但写入(将'1'改写为'0') 的速度很慢,擦除(将'0'改写为'r)的速度更慢,无法像DRAM那样用于对计算的直接支 持。它被制作成块设备化lock device),必须整块一起擦除,一个块化lock)包含很多页 (page),擦除后每页可W进行写入操作。NAND的另外一个问题是具有有限的寿命。
[0006] DRAM和NAND闪存,W及CPU的逻辑电路,虽然都是基于CMOS半导体工艺生产的, 但运=者的工艺彼此并不兼容。于是,计算机的=个核屯、部分无法在一个忍片上共存,运深 刻地影响了现代计算机的架构。
[0007] 现有技术中的计算机架构如图1所示,图1中示出多个CPU内核,分别为CPU1、 CPU2、CPU3、……、CP化,每个CPU内核一般具有相应的一级缓存化1 Cache),根据需要还 可W进一步为每个CPU内核配备相应的二级缓存化2 Cache)、S级缓存化3 Cache)。DRAM 与各个CPU内核之间通过双倍速率值DR,Double Data Rate)接口进行通信,硬盘(皿,Hard Disk)或固态硬盘(SSD,Solid State Drives)与各个CPU内核之间则通过外围设备接口 进行通信。
[0008] -方面,CPU在向多核的方向发展,另一方面内存和存储都在另外的忍片里。多 核CPU吞吐信息量成比例增加,与内存、存储的通信就越来越成为系统性能的瓶颈。为了 缓解通信瓶颈,CPU不得不采用越来越大的多级缓存。缓存是把内存中的内容复制,通常是 用成本比DRAM高得多但速度更快的静态随机存取存储器(SRAM, static Random Access Memory)设计的。运样的架构,费效比非常的差。半导体忍片的成本由其娃片的面积决定, 而传统计算机架构带来的性能提升与其娃片面积的增加远远不成比例。
[0009] 高端的图像传感器是可W在极短的时间内(微秒级)取得图像数据的,但一帖 高清图像的数据量很大,在目前的摄像系统中,考虑到现有计算机架构因 CPU与内存、存 储之间存在的通信瓶颈对于计算机整体性能的影响,把图像数据读出来通常就需要1/30 秒-1/60秒的时间,因此在绝大部分的摄像系统中,对视频的处理能力远远跟不上取得图 像数据的速度。而传统硬盘、固态硬盘、闪存写入的速度很慢,高速摄像的数据量很大,传统 存储设备跟上很困难。

【发明内容】

[0010] 本发明要解决的问题是目前的摄像系统由于现有计算机架构中CPU与内存、存储 之间存在的通信瓶颈对于计算机整体性能的影响,使摄像系统的图像处理能力较为有限, 难W满足高速摄像的更高要求。
[0011] 为解决上述问题,本发明技术方案提供一种摄像系统,包括:细胞阵列计算系统 和图像传感器;所述细胞阵列计算系统包括主控CPU、细胞阵列和细胞阵列总线;所述细胞 阵列是由一个W上兼具计算和存储功能的细胞组成的二维阵列,其中每一个细胞包括微处 理器(MPU,Micro Processing Unit)和非易失(NV,Not Volatile)随机存储器;所述非 易失随机存储器用于所述微处理器计算时所设及数据的随机存取,还用于存储软件的指令 代码和需要永久保存的数据;所述图像传感器是由一个W上图像采集单元组成的二维阵 列,所述细胞阵列与所述图像传感器叠合形成=维结构,所述图像传感器中的图像采集单 元与所述细胞阵列中的细胞一一对应地相连;所述图像采集单元用于采集图像数据W供 所述细胞阵列中的细胞进行处理;所述细胞阵列计算系统还包括存储单元阵列和内存单 元阵列中的至少一种;所述存储单元阵列是由一个W上存储单元组成的二维阵列,所述细 胞阵列与一个或一个W上存储单元阵列叠合形成=维结构,每个存储单元阵列中的存储单 元与所述细胞阵列中的细胞一一对应地相连;所述存储单元用于存储软件的指令代码和 需要永久保存的数据;所述内存单元阵列是由一个W上内存单元组成的二维阵列,所述细 胞阵列与一个或一个W上内存单元阵列叠合形成=维结构,每个内存单元阵列中的内存单 元与所述细胞阵列中的细胞一一对应地相连,所述内存单元用于所述微处理器计算时所设 及数据的随机存取;每一个细胞储存各自在所述细胞阵列中的位置作为身份识别号(ID, identification) W供细胞中的软件或硬件读取;所述主控CPU通过所述细胞阵列总线与 所述细胞阵列中的每一个细胞进行通信;所述细胞阵列中的相邻细胞之间有通信接口,能 相互发送数据。
[0012] 可选的,所述细胞阵列中的细胞还包括图像处理器,用于对与本细胞相连的图像 采集单元所采集的图像数据进行处理。
[0013] 可选的,所述细胞阵列计算系统含有一个或一个W上内存单元阵列,所述细胞阵 列中的细胞还包括总线控制器和细胞内部总线,所述总线控制器与所述细胞阵列总线、微 处理器W及细胞内部总线相连,所述细胞内部总线连接所述微处理器、非易失随机存储器 W及与本细胞相对应的内存单元,所述总线控制器用于识别所述主控CPU与本细胞之间进 行的通信,连接所述微处理器W传递所述主控CPU发送的指令或数据、状态读取,或者通过 所述细胞内部总线连接所述非易失随机存储器或与本细胞相对应的内存单元进行数据的 读写操作。
[0014] 可选的,所述细胞阵列中的任意两个细胞之间能进行通信,参与细胞间通信的细 胞包含起点细胞、终点细胞和中转细胞,所述起点细胞为向所述终点细胞发出数据的细胞, 所述终点细胞为最终接收所述起点细胞所发数据的细胞,所述中转细胞为沿细胞间通信路 径依次相邻且通过所述通信接口中转所述起点细胞所发数据的细胞,所述细胞间通信路径 是由所述起点细胞、中转细胞和终点细胞所构成的数据收发路径。
[0015] 可选的,所述细胞阵列中的任一细胞还能作为所述起点细胞向目标区域内的所有 细胞进行群发通信,参与所述群发通信且位于目标区域内的细胞作为所述起点细胞、或作 为所述终点细胞、或同时作为所述中转细胞和终点细胞,参与所述群发通信且位于目标区 域外的细胞作为所述起点细胞或中转细胞。
[0016] 可选的,所述细胞阵列中的细胞还包括与所述微处理器相连的网络控制器,所述 网络控制器用于在进行细胞间通信时,对发出的数据、中转的数据或者最终接收的数据进 行收发控制,还用于向所述微处理器发送中断信号。
[0017] 可选的,所述细胞阵列中的细胞还包括与所述网络控制器相连的一组或一组W上 先入先出队列(FIFO, First Input First Ou化Ut),各组先入先出队列分别对应一个与本 细胞相邻的细胞,每一组先入先出队列包括输入先入先出队列和输出先入先出队列,所述 输入先入先出队列用于存储输入本细胞进行中转的数据或最终接收的数据,所述输出先入 先出队列用于存储从本细胞输出的需进行中转的数据或本细胞向其他细胞发出的数据。 阳01引可选的,所述细胞阵列中还设有至少一个专职输出细胞,所述专职输出细胞作为 所述终点细胞接收并存储其他细胞给所述主控CPU的输出数据,并W中断信号通知所述主 控CPU读取所述输出数据。
[0019] 可选的,所述图像采集单元与所述细胞阵列中相对应的细胞之间通过过娃通孔 (TSV,T虹OU曲Silicon Vias)建立通信联系。
[0020] 可选的,所述主控CPU与所述细胞阵列和所述细胞阵列总线集成于一个忍片中。
[0021] 可选的,所述主控CPU作为独立的忍片,通过标准的内存接口与由所述细胞阵列 和所述细胞阵列总线组成的忍片进行通信。 阳02引可选的,所述非易失随机存储器为磁性随机存储器(MRAM,Magnetic Random Access Memoir),所述图像传感器为互补金属氧化物半导体(CMOS, Complementary Metal Oxide Semicon化ctor)图像传感器,所述存储单元阵列为闪存娃片,所述内存单元阵列为 MRAM、DRAM或SRAM娃片,所述细胞阵列在一个娃片上。
[0023] 为解决上述问题,本发明技术方案还提供一种图像识别系统,包括识别单元W及 上述摄像系统;所述识别单元用于对所述摄像系统处理后得到的图像进行识别。
[0024] 与现有技术相比,本发明的技术方案至少具有W下优点:
[00巧]通过将一个W上兼具独立计算和存储功能的单元(称为"细胞")组成二维阵列 (称为"细胞阵列"),其中每一个细胞包括微处理器和非易失随机存储器,所述非易失随机 存储器既能支持所述微处理器进行计算时所设及数据的随机存取,也能支持存储软件的指 令代码和需要永久保存的数据,使内存、存储、计算=个功能集成到每个细胞中,并使各细 胞之间形成密集的通讯网络,一方面,主控CPU能通过细胞阵列总线与细胞阵列中的每一 个细胞进行通信,另一方面,细胞阵列中的相邻细胞之间也能相互发送数据,由此能通过数 据群发和内部网络,克服现有计算机架构因 CPU与内存、存储之间存在的通信瓶颈,从而提 升计算系统的整体性能,并能使费效比较佳;在将上述具有细胞阵列的计算系统应用于摄 像系统的情况下,每一帖图像可W通过大量的通道读出并同时被处理,能够使摄像系统的 图像处理能力得W大幅提升,从而满足对于高速摄像的更高要求;此外,再通过将至少一个 由一个W上存储单元组成的存储单元阵列,W及至少一个由一个W上内存单元组成的内存 单元阵列,分别与所述细胞阵列叠合形成=维结构,并使每个存储单元阵列中的存储单元、 每个内存单元阵列中的内存单元与细胞阵列中的细胞一一对应地相连,如此便能W较低的 成本扩展细胞阵列中每个细胞的存储空间和内存空间,既提高系统的总存储带宽,能提高 各个细胞的数据存储能力,又能提高细胞中微处理器的处理效率,从而进一步提高所述摄 像系统的图像处理能力。
[00%] 进一步地,通过将包含细胞阵列计算系统的摄像系统应用于图像识别系统中,由 于每一帖图像的处理速度得到大幅提升,因此能够在更短的时间内实现对于每一帖图像的 识别,使该图像识别系统具有更快的图像识别能力,从而满足对于高速图像识别的要求。
[0027] 通过细胞阵列中相邻细胞之间的通信接口,实现相邻细胞之间对于数据的多次中 转,使细胞阵列中的任意两个细胞之间不依靠主控CPU便能进行通信,提高了细胞间通信 的效率,也降低了主控CPU的处理负担,从而能进一步提升计算系统的整体性能。
[0028] 通过将细胞间的点对点通信功能扩展到区域群发,可W支持更高的平行度,获得 高得多的总带宽,从而进一步提升计算系统的整体性能。
[0029] 通过在细胞阵列中设置专职输出细胞,W所述专职输出细胞作为所述终点细胞接 收并存储其他细胞给主控CPU的输出数据,并W中断信号的方式通知所述主控CPU读取所 述输出数据,如此能够在只有少数几个细胞需要向主控CPU输出数据时提高主控CPU读取 输出数据的效率。
[0030] 本发明技术方案提供的细胞阵列计算系统解决了 CPU和内存之间的通信瓶颈问 题。运样,在相同的娃片面积下,大量微型MPU的处理能力,在很多问题上远超少数几个顶 级CPU的处理能力,而耗电则低得多。
[0031] 本发明技术方案提供的细胞阵列计算系统使得计算机的架构更接近人脑,为未来 的人工智能算法提供了强有力的引擎。
【附图说明】
[0032] 图1是现有技术中计算机架构的示意图;
[0033] 图2是本发明实施例提供的细胞阵列计算系统的一种结构示意图;
[0034] 图3是本发明实施例的一种相邻细胞之间通信方式的示意图;
[0035] 图4是本发明实施例的另一种相邻细胞之间通信方式的示意图;
[0036] 图5是本发明实施例的细胞的结构示意图;
[0037] 图6是应用细胞阵列计算系统W流水线的方式计算Monte Carlo积分的示意图; 阳03引图7是本发明实施例的细胞阵列中进行细胞间通信的细胞的结构示意图;
[0039] 图8是本发明实施例的细胞阵列中细胞间通信的路径选择的示意图;
[0040] 图9是本发明实施例的专职输出细胞的实施过程示意图;
[0041] 图10是本发明实施例的细胞阵列中起点细胞在目标区域角上的细胞群发示意 图;
[0042] 图11是本发明实施例的细胞阵列中起点细胞在目标区域边上的细胞群发示意 图;
[0043] 图12是本发明实施例的细胞阵列中起点细胞在目标区域内部的细胞群发示意 图; W44] 图13是本发明实施例的细胞阵列中起点细胞在目标区域外的细胞群发示意图;
[0045] 图14是本发明实施例提供的细胞阵列计算系统的
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1