课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
文件系统是许多后端开发程序员都会用到的一个工具,而今天我们就通过案例分析来了解一下,文件系统的概念与优缺点。
文件系统的基本概述
文件系统定义:文件系统是一种存储和组织计算机数据的方法,它使得对其访问和查找变得容易。
文件名:在文件系统中,文件名是用于定位存储位置。
元数据(Metadata):保存文件属性的数据,如文件名,文件长度,文件所属用户组,文件存储位置等。
数据块(Block):存储文件的小单元。对存储介质划分了固定的区域,使用时按这些区域分配使用。
HDFS的概述
HDFS是Hadoop技术框架中的分布式文件系统,对部署在多台独立物理机器上的文件进行管理。
可用于多种场景,如:网站用户行为数据存储。生态系统数据存储。气象数据存储。
HDFS的优点和缺点
其除具备其它分布式文件系统相同特性外,还有自己特有的特性:
高容错性:认为硬件总是不可靠的。
高吞吐量:为大量数据访问的应用提供高吞吐量支持。
大文件存储:支持存储TB-PB级别的数据。
不适用场景
[1]低时间延迟数据访问的应用,例如几十毫秒范围。
原因:HDFS是为高数据吞吐量应用优化的,这样就会造成以高时间延迟为代价。
[2]大量小文件。
原因:NameNode启动时,将文件系统的元数据加载到内存,因此文件系统所能存储的文件总数受限于NameNode内存容量。,那么需要的内存空间将是非常大的。
[3]多用户写入,任意修改文件。
原因:现在HDFS文件只有一个writer,而且写操作总是写在文件的末尾。
【免责声明】本文系本网编辑部分转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题,请在30日内与管理员联系,我们会予以更改或删除相关文章,以保证您的权益!更多内容请在707945861群中学习了解。