您所在的位置:开发 > Java > 通过java.net.Socket类抓取网页内容

通过java.net.Socket类抓取网页内容

2006-10-13 10:22 赛迪网 字号:T | T
一键收藏,随时查看,分享好友!

本文由具体程序代码,通过java.net.Socket类访问一个Web页面,并且返回结果。

AD:

通过java.net.Socket类访问一个Web页面,并且返回结果。

<%@ control language="c#" autoeventwireup="true" codefile="webusercontrol2.ascx.cs" 

inherits="webusercontrol2" %>

import java.io.*;
import java.net.*;

public class FirstSocket
{
public static void main(String args[])
{

//判断参数是否为两个,正确的用法为 FirstSocket 网站页面
if(args.length!=2)
{
System.out.println("Usage : FirstSocket host page\r\nExample:

FirstSocket www.google.com /");
System.exit(0);
}
String strServer=args[0]; //取得第一个参数
String strPage = args[1]; //取得第二个参数

try
{
String hostname = strServer;
int port = 80;
InetAddress addr = InetAddress.getByName(hostname);
Socket socket = new Socket(addr, port); //建立一个Socket

//发送命令
BufferedWriter wr = new BufferedWriter(new OutputStreamWriter

(socket.getOutputStream(), "UTF8"));
wr.write("GET " + strPage + " HTTP/1.0\r\n");
wr.write("HOST:" + strServer + "\r\n");
wr.write("\r\n");
wr.flush();

//接收返回的结果
BufferedReader rd = new BufferedReader(new InputStreamReader

(socket.getInputStream()));
String line;
while ((line = rd.readLine()) != null) {
System.out.println(line);
}
wr.close();
rd.close();
}
catch (Exception e)
{
System.out.println(e.toString());
}
}
}

(责任编辑 火凤凰 sunsj@51cto.com  TEL:(010)68476636-8007)




分享到:

  1. 彻底透视CDN痛点,互联网老兵聊聊CDN的那些事儿!
  2. 3行Python代码完成人脸识别

热点职位

更多>>

热点专题

更多>>

读书

网管员必读—超级网管经验谈(第2版)
本书的第1版获得过“2006年度全行业优秀畅销品种奖”。全书共15章,分别介绍了网管员职责和应具备的工作习惯、共享上网与访问控

51CTO旗下网站

领先的IT技术网站 51CTO 领先的中文存储媒体 WatchStor 中国首个CIO网站 CIOage 中国首家数字医疗网站 HC3i 51CTO学院