您所在的位置: 首页>>开发>>JAVA>>

通过Java.net.Socket 类抓取网页内容

http://developer.51cto.com  2005-12-02 09:48    51CTO.com整理  我要评论(0)
  • 摘要:本文讲解如何通过Java.net.Socket 类抓取网页内容
  • 标签:Java  .net  Socket
/**
文件名 : FirstSocket.java
描述 :通过 java.net.Socket 类访问一个Web页面,并且返回结果
作者: 慈勤强 cqq1978@yeah.net
参考:http://java.sun.com
**/
import java.io.*;
import java.net.*;
public class FirstSocket
{
public static void main(String args[])
{
//判断参数是否为两个,正确的用法为 FirstSocket 网站 页面
if(args.length!=2)
{
System.out.println("Usage : FirstSocket host page\r\nExample:FirstSocket www.google.com /");
System.exit(0);
}
String strServer=args[0]; //取得第一个参数
String strPage = args[1]; //取得第二个参数
try
{
String hostname = strServer;
int port = 80;
InetAddress addr = InetAddress.getByName(hostname);
Socket socket = new Socket(addr, port); //建立一个Socket
//发送命令
BufferedWriter wr = new BufferedWriter(new OutputStreamWriter(socket.getOutputStream(), "UTF8"));
wr.write("GET " + strPage + " HTTP/1.0\r\n");
wr.write("HOST:" + strServer + "\r\n");
wr.write("\r\n");
wr.flush();
//接收返回的结果
BufferedReader rd = new BufferedReader(new InputStreamReader(socket.getInputStream()));
String line;
while ((line = rd.readLine()) != null) {
System.out.println(line);
}
wr.close();
rd.close();
}
catch (Exception e)
{
System.out.println(e.toString());
}
}
}
Java实用开发全集
Java类的基础教程专题
Java发展动态专题
专题:ASP.NET 2.0基础开发指南
.NET移动与嵌入式技术专题
 
 验证码: (点击刷新验证码)   匿名发表
  • Visual C++ 6.0完全自学宝典

  • 作者:强锋科技,朱洪波
  • Visual C++ 6.0是微软公司为程序人员提供的Visual Studio 6.0工具套件中的重要组成部分。本书由浅入深地介绍使用Visual C++ 6.0..
Copyright©2005-2008 51CTO.COM 版权所有