常见Hadoop Shell命令用法详解

开发 架构 Hadoop
在学习Hadoop的过程中,你可能会遇到Hadoop命令问题,这里就向大家介绍一些常见Hadoop Shell命令,希望本文的介绍对你的学习有所帮助。

Hadoop命令你是否熟悉,本节就像大家简单介绍一下常见Hadoop Shell命令方面的知识,欢迎大家一起来学习,希望通过本节的介绍大家对Hadoop Shell命令有更深刻的认识。

Hadoop Shell命令

FSShell

调用文件系统(FS)Shell命令应使用bin/hadoopfs<args>的形式。所有的的FSshell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme和authority参数都是可选的,如果未加指定,就会使用配置中指定的默认scheme。一个HDFS文件或目录比如/parent/child可以表示成hdfs://namenode:namenodeport/parent/child,或者更简单的/parent/child(假设你配置文件中的默认值是namenode:namenodeport)。大多数FSShell命令的行为和对应的UnixShell命令类似,不同之处会在下面介绍各命令使用详情时指出。出错信息会输出到stderr,其他信息输出到stdout。

cat
使用方法:hadoopfs-catURI[URI…]
将路径指定文件的内容输出到stdout。
示例:
hadoopfs-cathdfs://host1:port1/file1hdfs://host2:port2/file2
hadoopfs-catfile:///file3/user/hadoop/file4
返回值:
成功返回0,失败返回-1。

copyFromLocal
使用方法:hadoopfs-copyFromLocal<localsrc>URI除了限定源路径是一个本地文件外,和put命令相似。

copyToLocal
使用方法:hadoopfs-copyToLocal[-ignorecrc][-crc]URI<localdst>
除了限定目标路径是一个本地文件外,和get命令类似。

cp
使用方法:hadoopfs-cpURI[URI…]<dest>
将文件从源路径复制到目标路径。这个Hadoop Shell命令允许有多个源路径,此时目标路径必须是一个目录。
示例:
hadoopfs-cp/user/hadoop/file1/user/hadoop/file2
hadoopfs-cp/user/hadoop/file1/user/hadoop/file2/user/hadoop/dir
返回值:
成功返回0,失败返回-1。

du
使用方法:hadoopfs-duURI[URI…]
此Hadoop Shell命令显示目录中所有文件的大小,或者当只指定一个文件时,显示此文件的大小。
示例:
hadoopfs-du/user/hadoop/dir1/user/hadoop/file1hdfs://host:port/user/hadoop/dir1
返回值:
成功返回0,失败返回-1。

dus
使用方法:hadoopfs-dus<args>
显示文件的大小。

expunge
使用方法:hadoopfs-expunge
清空回收站。请参考HDFS设计文档以获取更多关于回收站特性的信息。

get
使用方法:hadoopfs-get[-ignorecrc][-crc]<src><localdst>
复制文件到本地文件系统。可用-ignorecrc选项复制CRC校验失败的文件。使用-crc选项复制文件以及CRC信息。
示例:
hadoopfs-get/user/hadoop/filelocalfile
hadoopfs-gethdfs://host:port/user/hadoop/filelocalfile
返回值:
成功返回0,失败返回-1。Hadoop Shell命令还有很多,这里只介绍了其中的一部分。

【编辑推荐】

  1. 轻松实现Hadoop Hdfs配置
  2. 专家指导 如何进行Hadoop分布式集群配置
  3. Hadoop集群与Hadoop性能优化
  4. HadoopHBase实现配置简单的单机环境
  5. 深入剖析Hadoop HBase

 

责任编辑:佚名 来源: it168.com
相关推荐

2014-08-06 09:57:15

hadoop ShelShell命令

2010-06-03 17:38:03

Hadoop命令

2010-06-02 13:24:02

SVN用法

2021-06-09 17:51:12

Hadoop数据迁移

2013-12-02 09:49:59

2010-05-25 14:32:09

Linux tcpdu

2010-05-25 17:13:26

SVN子命令log

2020-07-09 08:09:21

Linuxdiff命令

2010-07-20 14:27:46

Perl命令行

2010-07-15 12:45:30

Perl命令行

2023-11-30 12:03:06

linuxAwk

2010-06-24 14:49:00

Linux Cat详解

2010-03-08 16:55:32

Linux chgrpchown命令

2009-08-11 10:45:58

linux中du命令参linux命令行参数linux命令行

2019-09-03 15:26:52

Linuxawk文字数据

2010-06-03 18:22:38

Hadoop

2017-03-08 11:10:39

LinuxShell命令

2009-08-03 11:54:34

linux at命令linux at命令详cron

2017-06-15 10:32:56

OracleDBV命令行工具

2010-05-24 14:57:10

SVN子命令
点赞
收藏

51CTO技术栈公众号