首页汽车基础正文

汽车知识图谱（汽车知识图谱图片）

汽车基础 2年前(12-24) 101

今天给各位分享汽车知识图谱的知识，其中也会对汽车知识图谱图片进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！本文目录一览： 1、AI赋能车载输入法，汽车智能化的重要支点

今天给各位分享汽车知识图谱的知识，其中也会对汽车知识图谱图片进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、AI赋能车载输入法，汽车智能化的重要支点
2、为什么长城汽车有底气做自动驾驶？从咖啡智驾的CSS模型说起
3、知识图谱基础（三）-schema的构建

AI赋能车载输入法，汽车智能化的重要支点

车机要够智能,输入法得跟上。

吐槽车机难用,可能是你的输入法没选对。

近几年来,智能化已经成为了汽车市场中极为重要的一个指标。

但在实际的体验以及评测当中,车东西发现市面上的不少车机系统都忽略了一个共有的硬伤——车机上的输入法太难用了……

设想一下,为了方便,你在车上大屏上手写输入,但手写识别的不准,反而输错文字;用键盘拼音输入,只能用全拼输入才能找到想要的词汇,如果一次打的字段太长有时还会卡住……相信我,你一定会被气得想要写一篇万字长文来控诉这些装在车机上的鸡肋输入法。

且看当前的C端市场,已经有不少成熟的输入法产品可供选择,那么在车机这种B端场景上,也亟需一款能够解决当前消费者痛点的产品。近几年,陆续有些输入法品牌已经开始进入B端赛道,而拿下吉利、嬴彻订单的百度输入法就是其中之一。

01.智能汽车快速发展小小输入法成拦路虎

马斯克曾表示,未来的汽车就是一个带轮子的电脑;造车新势力们纷纷用黑科技吸引年轻一代的消费者;传统车企们也下场在智能座舱上发力……可以说八仙过海,各显神通。

以车东西团队自身的使用感受为例,在车内功能更加人性化、智能化后,当体验到不智能的输入功能可以说是“一夜打回解放前”,这种不愉快的体验感瞬间会被放大。

首先由于不同车机屏幕的摆放位置、尺寸都有不同,我们会发现车机屏幕上出现的键盘布局会有所差异,经常会出现点错的情况;二是在拼音输入时,可能是因没有定制词库,无法像手机上第三方输入法一样快速联想想要的词汇,影响输入的速度;三是如果尝试在车机屏幕上进行手写,又常出现识别不准,需要反复进行操作的情况;甚至在输入过程中输入法时不时出现卡顿……

那么回到最根本的问题,车机输入法到底重不重要?答案是当然。

其实车机的输入法难用,归根结底还是因为车机上没有装上一款真正适配于行车场景下的输入法——目前车机上输入法的选择更多还是被掌握在车企厂家手中,就目前而言,消费者更多地只能是被动接受车机上原装的输入法,而这些原装输入法存在的各种各样的问题也会引发消费者对车企品牌的负面口碑。

无论是从用户的产品体验来看,还是从车企的智能化布局来看,整个智能汽车行业都必须要有一款真正智能的输入法产品。

02.百度输入法上车AI赋能解决输入难题

从目前的车机输入法产品来看,车企自身很难快速地给出一款满足这样需求的产品。从这个角度来说,B端市场的输入法产品就显得尤为重要。

百度输入法作为在C端赛道已经耕耘多年的头部输入法产品,在词库、AI等智慧输入方面都有比较深的技术积累。

车东西从百度输入法相关负责人处了解到,目前百度输入法已经和国内头部传统车企、新能源造车势力、还有国际知名车企都已经有合作,包括如吉利领克、嬴彻科技等品牌。

那么,在C端驰骋多年的成熟产品——百度输入法是如何完成“跨界”的?

AI无疑是其核心竞争力。

1、定制化词库猜懂车主的“心”

针对输入法词库方面,百度输入法在C端市场多年的积累就显现出了优势——通过百度长达20年中文搜索积累,千亿级关系组成的知识图谱,强大的理解解析能力为精准输入提供有力支持。此外基于深度神经网络的智能语言模型,百度输入法还形成了亿级云端词库,能够根据各种场景实现定制词库。

比如在车内输入场景下,地址输入是非常高频的一个需求。针对这一需求,百度输入法搭建了地理词库,在输入同样内容的前提下优先联想推荐地名,快速命中车主的“心思”。

▲百度输入法智慧输入解决方案——为嬴彻科技定制的智慧车载输入法

除了地理词库,百度输入法智慧输入解决方案,还包含全国行政区划的词库联想,输入行政区词汇,便可联想下一级行政区词汇。这也就是说,如果车主直接输入「北京」,那么输入法就可以自动联想出「海淀区」、「朝阳区」、「顺义区」等词汇,有效提升输入效率。

用过百度输入法的都知道,场景化出词是一个非常好用的功能。它能基于用户使用的不同APP,快速找到关联场景下的词汇,大大提升用户的输入效率,并且这项功能是基于本地算力的,也就是说就算没有网络,也能够调用AI进行场景化出词。目前这项功能已被应用在吉利领克、嬴彻科技等车型上。

当然,除了场景化出词之外,百度输入法定制的车载输入法也在简拼上下了不少功夫。

简拼输入指的是只输入声母或声母的首字母,即可自动联想识别出常用词汇,比如输入「cygy」就会自动联想出「朝阳公园」一词。

目前百度输入法的车载输入法不仅能根据简拼输入直接显示地点,还支持中文、英文、数字混合输入,能够很好地提升驾驶员在车内的输入效率,提升输入体验。

2、高精准识别各类手写字

手写输入是大量车主习惯使用的输入方式。从当前车机环节来看,很多主屏幕处在中控的中央位置,与驾驶员和副驾乘客之间存在一定角度,这种情况下在车机屏幕上写出来的文字都是倾斜的。普通输入法只能识别竖置的文字,斜置的字很容易被识别成其他字,如果识别率不够高的话会耗费用户大量精力,这也是目前车机手写功能中存在的一大痛点。

倾斜角度的多变,左倾斜、右倾斜以及不同的角度手写都给手写识别算法带来不小挑战。针对车内手写场景,百度输入法通过技术研发提升了倾斜手写的识别效果,即使用户写出歪歪扭扭的文字也能够准确被识别,有效缓解用户在手写输入场景中因人机工程学问题带来的尴尬。这一技术功能也成功搭载在了嬴彻科技的智能卡车车机上,可实现手写高精准识别,准确率高达***%。

▲百度输入法为嬴彻科技定制的智慧车载输入法

(倾斜手写效果展示)

同时,百度输入法还提供了自由写的功能,即支持单字、叠写、连写等形式的自由书写。无论你的书写风格多么“个性”,手速多快,百度输入法都能够快速且高精准识别,在提高输入效率的同时潜移默化地影响车主对车机的满意度。

▲百度输入法为嬴彻科技定制的智慧车载输入法

(自由写效果展示)

此外,百度输入法针对行车场景定制的核心功能,比如拼音输入、智能出词、智能纠错、手写输入等都可以在本地进行,无需连接网络。即使你身处信号不好的环境,也丝毫不影响使用体验。

3、与车企品牌紧密配合打造流畅体验

值得注意的是,输入法上车与在手机上下载输入法其实是完全不同的。那百度输入法又是如何在车内输入场景实现“纵享丝滑”的?

据百度输入法相关负责人表示,虽然不同的车企品牌在自家的车机上所应用的系统UI、屏幕规格、硬件等各不相同,百度输入***根据车企提前给到的设备信息、输入场景需求来进行定制化适配,打造智慧输入解决方案,实现“1+12”的效果。

此外,对于不同的品牌,百度输入法也会进行定制化视觉效果适配。基于市面上主流车机尺寸及发展趋势,以及人机交互习惯,在键盘大小、按键大小、按键缝隙等键盘设计以及功能层面进行品牌专属设计,百度输入法可以说下足了功夫。

百度输入法还在车机上推出了传统模式、悬浮模式两种不同布局模式。在较大屏幕的车机上,如果用户想要聚焦浏览屏幕内容,可使用悬浮模式,这样既不遮挡屏幕,又能自由拖动位置。而较小的车机屏幕上可以选择传统模式,即我们正常在手机端使用输入法时,贴合屏幕底部的模式。

03.赋能B端厂商百度输入法走向更多行业

当汽车成为四个轮子上的电脑,智能软件就成为车企们提升价值的关键利器。

智能化已经成为汽车行业增长的重点,这点已经毋庸置疑。随着汽车越来越智能,AI在汽车中也就更有可为的空间。

依托百度强大的AI能力,百度输入法在车载输入法领域已经展现出了自己的优势。实际上,百度输入法在B端市场也早有布局——在智慧办公层面,百度输入法整合了语音、翻译、OCR、搜索、词库等AI能力,打造了智慧办公整体解决方案,可帮助员工实现快速检索、文字扫描内部相关资料、文献查询、多语言无障碍沟通等,快速提升办公效率。

在智慧终端层面,百度输入法适配各类终端及其应用场景,定制了多种输入方案,如面向电脑、平板、大屏可定制会议设备手写输入等。并且百度输入法除支持Android、iOS、Windows、Mac,也能够与UOS、麒麟等国产操作系统适配。百度输入法在针对国产系统的积极布局,一定程度上推动了信创输入的智能升级。

随着汽车产业迈向智能与电动、智慧终端形态和应用场景多变,B端市场对输入法有了更高的需求。这时,从C端起家的百度输入法瞄准了B端市场,***其输入法领域多年的优势,并用AI赋能汽车产业。百度输入法通过搭载车机系统,不仅提升了用户使用车机的体验与对品牌的口碑,更为车企一直追求的智能化品牌提供了增量空间。可以预见,在不远的未来,输入法将成为智能汽车产业走向升级的重要支点。

想了解更多解决方案,可搜索“百度智慧输入”进入***。 @2019

为什么长城汽车有底气做自动驾驶？从咖啡智驾的CSS模型说起

像大黄蜂、擎天柱一般有智慧能思考的“汽车人”成为汽车智能化发展的目标与方向。当前，行业内各大车企也在纷纷努力给汽车注入更多智能基因，不断向自动驾驶迈进，但囿于技术限制，大多数智能汽车都还处于感知智能阶段，无法完全实现安全自动驾驶，因为当人工智能算法对相应的驾驶数据信息进行判断时，会因数据库不完整而难以做出正确抉择，进而导致判断失误，出现安全问题。

那么，面对复杂的自动驾驶场景，长城汽车的底气又从何而来呢？

能思考会学习实现每一种场景中的准确判断

想要真正实现安全的自动驾驶，汽车需要具备更高阶的认知智能，具备学习、思考和判断等认知能力，能够在驾驶过程中随机应变，除了需要解决车的环境感知、信息融合、路线规划等问题，还需要具备对随时变化的交通环境数据进行推断的功能，从而能够在各种复杂场景中做出快速科学的驾驶判断。

为此，长城汽车针对中国特色的复杂交通状况，通过知识图谱的方式，首创以CSS模型为核心的双认知智能模型，可理解为协同场景安全认知智能模型。这个模型具有思考和学习的能力，不仅可以适应环境，还可以将用户的每一次路况难题记录下来，然后形成大量经验，并将经验总结成了一些公理，再通过专家系统、模式匹配等应用实例找到这些问题的解决办法，成为具有认知智能的AI，在下一次遇到类似问题时自动判别，找到与问题相对应的解决办法。

目前CSS模型总结出的公理包括在事故多发场景下保持警惕，提前规避，避免出现在其他交通参与者的感知盲区等，主动和其他交通参与者交互表达自身驾驶意图，在车辆能力下降时***用谨慎的驾驶策略，让速不让道等，大幅提升了复杂交通状况下自动驾驶的安全性。

数十万复杂场景积累保障每一次自动驾驶的安全

为了保障自动驾驶在每一个场景中的科学判断，CSS模型***用专家库方式来定义自动驾驶场景，并结合了场景安全因子，应用数据驱动的方式来解决自动驾驶的规控问题，目前在专家库方面，长城汽车已经积累了数十万个典型的自动驾驶场景，覆盖自动驾驶过程中“高速主路－城市开放路－城市快速路－上下匝道－路口”全路形行驶，在不同的交通场景下，均能执行可靠的自动驾驶策略动作，如行人礼让，自动变道等。

值得一提的是，长城汽车CSS模型专家库所积累的海量自动驾驶场景中，大部分是通常所说的自动驾驶“绊脚石”——CONER CASE，也就是不同于常规驾驶场景的复杂边角场景，例如，一个人带着一条狗在高速公路上跑、一匹马车在车流中穿梭等，而当前的AI在面对以上没有学习过的特殊场景时便会表现得束手无策，造成安全问题。CSS模型***用了传统深度学习和增强学习双核心技术，掌握海量边边角角的场景的同时还能实现一些个性化的自生长场景，并科学匹配相应驾驶模式，对于一些没有遇到过的CONER CASE，还能根据专家库挖掘出与之匹配的模式，有效解决自动驾驶应用于复杂场景的驾驶问题，高效助力真正自动驾驶时代到来。

CSS双认知智能模型构建了长城汽车咖啡智驾认知智能的基础根基。作为咖啡智能2.0中的重要一环，咖啡智驾与全新电子电气架构、智慧线控底盘、智能座舱等智能化杀手锏的完美配合，使汽车成为有思想、个性化、可成长的智慧出行伙伴。相信随着长城汽车在智能化领域的不断投入与发展，咖啡智能将实现快速突破，加速长城汽车向全球化智能科技公司转型，而“汽车人”的梦想场景也终将走入我们的生活。

汽车知识图谱（汽车知识图谱图片）

知识图谱基础（三）-schema的构建

在前面一篇文章《知识图谱基础（二）-知识表达系统》中介绍了知识图谱的基础知识表达系统，什么是entity，什么是relation，什么是domain，什么是type等等。本篇文章主要从应用角度来聊一聊如何构建schema以及shcema构建中需要考虑的问题。以下所讲的schema构建主要是基于common sense进行构建的，弱关系图谱构建会在应用中讲到。

简单来说，一个知识图谱的schema就是相当于一个领域内的数据模型，包含了这个领域里面有意义的概念类型以及这些类型的属性。任何一个域的schema主要由类型（type）和属性（property）来表达。图1是plantdata内的创投schema，主要是为了发掘一级市场的投资和融资构建的schema。该schema主要是去定义需求，哪些数据对创投有用，才往上构建，例如：人物都有身高体重，但是这些数据对创投来说意义不大，在schema中就不用构建了。关注创投的人会关注这些基金与人物投资了哪些公司，投资的公司所属行业，投资的公司属于哪一类企业，在该schema中就需要详细构建。

1.如何构建域（domain）

域（domain）的概念是凌驾于所有类型之上，对于域的定义应该尽量的抽象，不应该具体，同时域与域之间应尽量做到相互独立，不交叉。例如，省份就不应该是一个域的概念，在思考是否应该把一个概念当做域时，需要考虑到该概念是否能够继续向上抽象，例如：省份；城市；国家；县等等，他们同属于地理位置域。在明确域的概念时，应该定义好域的边界，这样比较容易区分不同域之间的区域划分。

2.如何确定一个域的类型（type）

这里需要产品经理去思考，构建这个schema的核心需求是什么，到底需要解决用户什么问题。为了满足这些核心需求，我们需要创造出哪些概念？

举个例子，在汽车领域，用户主要关心什么问题，例如：汽车的品牌、车系、发动机。

在NBA领域，用户主要关心球队、所属联盟、教练、球员等等。

针对不同的需求，需要在域下面构建不同的类型来满足用户的需求。

3.如何确定属性（property）

思考的角度如下：

1.以用户需求为出发点

2.以数据统计为证据

比如在构建完足球领域中的球队类型后，该类型***了所有的球队实体，站在用户角度触发，用户会关注球队的哪些关系？

图2是我简单的针对足球领域构建的一个图谱，上面包含了梅西（球队的球员），埃内斯托·巴尔韦德（球队的教练），西甲（球队的所属联赛），其中梅西、西甲、埃内斯托.巴尔韦德又分属于不同的类型：足球球员，足球联赛，足球教练，这些所有的类型构成了足球域。

从上图的common sense配合图查询和自然语言处理技术已经可以支持基础的问答了，例如，梅西是哪个球队的？埃内斯托巴尔韦德是哪些球员的教练？西甲有哪些球队在踢球？等等

schema的应用是产品经理需要重点考虑的内容，因为产品需求决定了schema应该怎么构建，构建的是否完备。而产品的具体应用则主导了schema的整体构建方式，如果不仔细考虑产品应用的话，最惨的情况可能构建了很久的schema会因为一个逻辑坑而彻底报废掉，由于知识图谱又是一个牵一发而动全身的工程，根据实际经验来说，如果图谱构建和应用有部分脱节，可能修改图谱schema比重新构建图谱schema的成本还要高。所以，首先确认好具体的应用场景对于一个schema构建的成功与否是至关重要的。

笔者写一套曾经用过的确认schema的流程

先将应用根据需求的强弱划分，分为基础核心需求，schema特色需求，锦上添花需求，未来扩展性需求。

基础核心需求：是经过需求分析后，构建这个schema需要完成最核心的需求，该需求优先级最高

schema特色需求：构建图谱时可能会经常遇到图谱可以实现而其他方法实现比较困难的特色需求，这类需求可能需求强度不是很高，但是由于能够实现一定的差异性，经常会有意想不到的效果。

锦上添花需求：非基础核心需求，做了更好，不做也可以接受

未来扩展性的需求：确认schema的时候要充分考虑到未来的扩展性，因为这类需求有可能会大改图谱的schema结构

在构建schema的时候，根据上述分类，需要去考虑该schema一期需要满足哪些具体的功能，将功能一一列下来，哪些功能是需要放在第二期、第三期完成的，未来的扩展性需求需要在构建的哪一块区域留下可扩展的内容。

常用的方法可以使用excel去列出一、二、三期所需要的功能点。

列出上述的功能点后，针对每一个功能点在后面备注好该功能的构建要点（注：这个非常重要），通常需求只需要将产品需求转化成一定的查询结构即可，笔者原来用的是cypher查询语法。以图2为例，我要支持某个教练教了哪些球员？转化成查询语言就是（a:足球教练）-{b:教练}-（c:球队）-{d:球员}-（e:足球球员） return e。将a变成参数，输入a即可返回所有的e，即输入埃内斯托巴尔韦德，返回就是梅西。

流程如下：query:埃内斯托巴尔韦德带了哪些球员？→语义解析→转化成上述查询，将埃内斯托巴尔韦德作为参数a代入查询→返回结果→前端包装展示

注：上面在每个功能点后面备注了构建要点，当大部分功能点的构建要点都写完的时候，需要集中查看构建要点，因为如果需求本身比较大的话，不同的需求很容易造成schema的构建冲突，正如前面所讲，schema尽量要保证少出错。这个时候由于备注了构建要点，可以全局的来审视这个schema中间有没有逻辑黑洞。常出现的问题主要是在属性的设计，以及知识融合上。

拿着上述文件去找开发，确认一下哪些是比较好实现的，一般来说做到这种程度大多数需求开发都是会接的。如果开发同学足够专业的话，他会从他的视角去给你提出他的宝贵意见。通常产品经理在思考schema这一块更倾向于思考这个schema的作用，而开发同学会思考工程实现、实现效率、运行效率、计算量等问题。

大规模构建schema的时候需要认真考虑数据源的情况，由于不同公司掌握的数据不同，所应用的对策也不同。

通常笔者会将数据源分为如下几种：

1.已经清洗好的结构化数据：这部分数据一般是公司的核心数据，或者其他公司的核心数据，构建的时候应该优先考虑这类数据。这部分数据通常只需要改变数据格式即可入图谱。

2.清洗好的结构化数据，但数据残缺：这部分数据通常需要数据挖掘，知识融合。清洗难度是由残缺比例决定的。

3.无数据：没有这部分数据，但是又需要这部分数据，通常只能去选择让BD去购买数据，或者让爬虫组去专业网站爬取，例如：企业数据可以去企查查，电影的数据可以去猫眼，产业的数据可以去产业信息网等等。

***设需要构建的图谱entity数量在千万级别，开发力量不够强大的时候，慎用纯数据挖掘方案，有条件的话笔者建议直接去买结构化数据，因为可能挖掘和知识融合在经济上的成本比直接买数据要高，而且时间周期也会很长。

个人认为，大规模构建schema最难的地方就在于挖掘数据的知识融合上，举个例子：全国有10000个叫王刚的人，爬虫从A网站挖下来5000个“王刚”，从B网站挖下来7000个“王刚”，那么这5000个王刚和那7000个王刚到底是不是一个人？在没有***号码的情况下如何确定哪些王刚是一个人呢？常规的做法是去挖掘出“王刚”的其他信息，例如出生年月，任职信息，籍贯等等，然后通过一定的算法进行知识融合。通常，网站的数据不一定全面，即使经过知识融合后，挖掘的数据中一定会有大量的噪音，不同的需求对噪音的承受能力是不同的，构建schema的时候需要充分考虑数据出现噪音的可能性，去评价这部分需求对噪音的承受能力。

如果知识融合完成了话，大规模构建其实就是一个导数据的过程，由于图谱数据结构的关系，一般存2张表（点、边）或者使用RDFs存储，在entity数量上千万以后，图谱的查询压力会比较大，单机查询可能会直接跪掉，开发一般会***用graphX的分布式的存储，不过由于点和边的切割方式的问题，会有一定的副作用。

汽车知识图谱的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于汽车知识图谱图片、汽车知识图谱的信息别忘了在本站进行查找喔。

汽车知识图谱