摘要随着信息技术和计算机网络的发展,数据正在以惊人的速度不断产生,面对日益庞大的数据规模,单一主机的容量和运行速度都已经不能满足大数据处理的需求。信息的形式越来越多样化,除了单纯文本,图片等媒体文件在人们生活中扮演的角色越来越重要。随着经济的发展,对图像的处理技术被应用到各行各业,集装箱的箱号识别就是其中之一。本文将大数据处理技术与图像识别技术结合起来,共同应用于集装箱的箱号识别。 

本文的工作主要有以下两点:1、分析集装箱箱号的分布特点,对箱体图像进行数字处理,获得箱号字符;2、使用Spark为箱号字符的识别算法加速。

研究发现,在处理自然环境下的集装箱图片时,虽然图片变化多端,但箱号字符的排列具有共性,根据这一特点可以过滤杂质获得字符;Spark技术适用于大规模的数据集操作,数据集越庞大,加速效果越明显。74288

毕业论文关键词  图像处理 模式识别 Spark 大数据

毕业设计说明书外文摘要

Title          Acceleration algorithm of image similarity comparison based on Spark           

Abstract With the development of information technology and computer network, the data is constantly being produced at an amazing speed。 The performance of a single machine cannot meet the needs of big data processing in the face of the size of data sets which is growing huger than ever。 The format of information also becomes persified。 The media files, such as pictures, are playing more important roles in people’s lives。 The technique of image processing is applied into the various walks of life with the development of economy。 The recognition of Container numbers is an example among them。 This paper makes combination of big data processing and image processing and take advantages of them to enhance the recognition of Container numbers。

This paper has the following points:1、Analyze the distribution law of Container numbers and do digital processing of Container image to get matrix of numbers; 2、Accelerate the algorithm of recognition of Container number by using Spark。

The study found that when processing Container images under the natural environment, the numbers arrangement is with great commonness even though the images are the most changeful。 And we can make full use of the commonness to filter the noise。 It also turns out that the Spark technology is apply to process large data sets。 The larger the data set, the better the effect of the acceleration。

Keywords  image Processing  pattern recognition  Spark  big data

目   次

1  绪论 1

1。1  课题背景、项目意义 1

1。2  相关知识简介 1

1。2。1  集装箱及箱号 1

1。2。2  图像处理相关技术介绍 3

1。2。3  KNN算法介绍 5

1。2。4  Spark介绍 5

1。3  全文篇章结构 6

2  研究发展现状 8

2。1  图像处理 8

2。2 集装箱箱号识别 9

2。3  模式识别 9

2。4  大数据处理技术 10

3  算法模块与定义 12

上一篇:Java+mysql银行设备管理系统的设计与实现
下一篇:稀疏数据上动态个性化推荐

《信息技术课程标准》微课的设计与制作

《读书交流分享》APP的设计与开发

《信息技术课程标准》系列微课的设计与制作

《大学生课堂教学管理与...

教育技术学专业技能学习网站的设计

基于Android的电子拍卖系统设计与开发

基于Web应用的致胜公司企业内部培训系统设计

新疆农林高校學生昆虫生...

日语论文中日酒文化对比研究

发酵米粉优势菌株的发酵特性研究

激光模拟训练器材国内外研究现状

大淘宝网的虚假交易研究

个案管理茬老年糖尿病患...

淮安市高校足球运动损伤问卷调查表

肢体语言在小学英语教学中的应用浅谈

2021年什么行业赚钱,适合...

浅谈农村大气环境保护的制度构建【1868字】