博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
乐透TV:php 优酷视频采集,小示例(基于phpquery)
阅读量:5811 次
发布时间:2019-06-18

本文共 1191 字,大约阅读时间需要 3 分钟。

<?php
set_time_limit(0);
require '../global.php';
header("Content-type: text/html; charset=utf-8");
L::loadClass('phpQuery' , 'utility' , false);
$url = S::getGP('url');
$vodID = getYoukuID($url);
phpQuery::$documents = null;
phpQuery::$defaultCharset = 'GBK';
phpQuery::newDocumentFileHTML($url);
echo pq("title")->html();
$num = (int) pq("#zySeriesTab")->find('li')->length();
$num = $num>0 ? $num : 1;
echo '<pre>';
for($i=0;$i<$num;$i++){
  $key = ($i*40)+1;
  $reload = "reload_".$key;
  $juji = "http://www.youku.com/show_episode/id_{$vodID}.html?dt=json&divid={$reload}";
  $data =  getJuJI($juji);
 
  foreach($data as $value){
  echo $value."\n";
  }
}
echo '</pre>';
function getYoukuID($url)
{
preg_match("~id_(.*).html~", $url,$arr);
return $arr[1];
}
function getJuJI($juji)
{
phpQuery::$documents = null;
phpQuery::$defaultCharset = 'utf-8';
//$content = file_get_contents($juji);
//phpQuery::newDocumentHTML($content);
phpQuery::newDocumentFileHTML($juji);
$aList =  pq("a");
foreach ($aList as $a)
{
$key =getYoukuID(pq($a)->attr('href'));
$value = pq($a)->html();
$data[] ="第{$value}集\${$key}";
}
return $data;
}
采集结果:
图片
 
用于: :

转载于:https://www.cnblogs.com/letoutv/archive/2013/02/28/2936542.html

你可能感兴趣的文章
微软的云策略
查看>>
Valid Parentheses
查看>>
【ES6】数值的扩展
查看>>
性能测试之稳定性测试
查看>>
ES6的 Iterator 遍历器
查看>>
2019届高二(下)半期考试题(文科)
查看>>
nginx 301跳转到带www域名方法rewrite(转)
查看>>
AIX 配置vncserver
查看>>
windows下Python 3.x图形图像处理库PIL的安装
查看>>
【IL】IL生成exe的方法
查看>>
network
查看>>
SettingsNotePad++
查看>>
centos7安装cacti-1.0
查看>>
3个概念,入门 Vue 组件开发
查看>>
没有JS的前端:体积更小、速度更快!
查看>>
数据指标/表现度量系统(Performance Measurement System)综述
查看>>
GitHub宣布推出Electron 1.0和Devtron,并将提供无限制的私有代码库
查看>>
Angular2, NativeScript 和 React Native比较[翻译]
查看>>
论模式在领域驱动设计中的重要性
查看>>
国内首例:飞步无人卡车携手中国邮政、德邦投入日常运营
查看>>