XPathの人気記事 11件 - はてなブックマーク

1 - 11 件 / 11件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

XPathの検索結果1 - 11 件 / 11件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

XPathに関するエントリは11件あります。プログラミング、資料、スクレイピングなどが関連タグです。人気エントリには『【JavaScript】querySelector よりもパワフルに DOM からノードを取得しよう！【XPath】 - Qiita』などがあります。

【JavaScript】querySelector よりもパワフルに DOM からノードを取得しよう！【XPath】 - Qiita
- 116 users
- qiita.com/ment_RE
- テクノロジー
- 2024/01/27
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
XPathとは | Octoparse
- 11 users
- www.octoparse.jp
- テクノロジー
- 2020/09/23
「XPath」とは、Webサイトの特定の部分を効率的に識別し、データを抽出するための言語を指します。この技術は、Webクローラーやスクレイピングツールにおいて中心的な役割を担い、Pythonなどのプログラミング言語やOctoparseのようなツールを使用する際に不可欠です。 XPathの使い方を理解することで、目的のデータを正確かつ迅速に取得することが可能になります。本記事では、XPathの基本的な概念を初心者にもわかりやすく解説し、実用的な書き方や役立つ関数について詳しくご紹介します。この記事を読むことで、XPathの基礎知識を身につけ、効果的なWebデータ収集のスキルを習得できるでしょう。 Xpathとはそもそも「XPath」とは何を示すのかわからない方も多いでしょう。ここでは、XPathの基本概念や仕組みをかんたんに紹介します。 XPath （XML Path Language）
- スクレイピング
- プログラミング
XPathの記法メモ
- 6 users
- zenn.dev/yu_no
- テクノロジー
- 2024/04/02
数年前にWebページの一括編集の自動化などで、CSSセレクターでは複雑なノードの参照が難しかったため、XPathを使った際にまとめた記法などをメモとして残しておきます。
運用していたサービスにSQLインジェクションのような文字列が来たので調べてみた(XPathインジェクション)
- 4 users
- zenn.dev/fagai
- テクノロジー
- 2021/04/11
こんにちは。本日、運用してたサービスのエラーログを見てたところ不審なログがあり、SQLインジェクションじゃないか？と思いまして調べた話です。一応先に言っておくと、エラーメッセージを活用して情報を取ろうとしていて(XPATH Injection)、その事前確認のSQLのようでした。埋め込まれようとしていた文字列外側に関しては省きますが、埋め込もうと考えられていた文字列は以下です。 EXTRACTVALUE(8172,CONCAT(0x5c,0x716a766271,(SELECT (ELT(8172=8172,1))),0x7178717171))

RubyでXPath 1.0 パーサを実装した - Qiita
- 4 users
- qiita.com/namusyaka
- テクノロジー
- 2020/12/25
この記事はドワンゴ Advent Calendar 2020 16日目の記事です。アドベントカレンダーが好きすぎて、これに加えて最終日も書かせていただきます。急拵えなので内容は薄いですが、興味があればお付き合いください。はじめにこの記事で紹介するXPath 1.0パーサは、ドワンゴ Advent Calendar 2020 最終日にて紹介予定のHTMLパーサである「gammo」向けに開発したものである。最終日の内容はHTMLパーサに特化したものとなるため、この記事ではgammoが構築したDOMツリーをtraverseするための仕組みとして、XPath 1.0を実装した話を紹介する。 XPath 1.0は1999年に勧告されたXSLT 1.0と同時に公表されたもので、現在の最新バージョンである3.1と比較すると非常に機能が少ないシンプルな仕様となっている。 XPath 1.0を選択した
- Ruby
Python、lxml、デフォルト名前空間とXPath | デバイスビジネス開拓団
- 4 users
- jhalfmoon.com
- テクノロジー
- 2020/11/04
私なんぞは「その筋」の専門家でもなんでもないので、XMLと向き合わなければならないことなどさほど多くはありません。時折あるそんな機会も、とりあえずPythonでlxml使っておけばOK、てな感覚でおりました。XPath便利ですし、lxmlは速いのではないですかね。でもね、たまに困ることがあります。名前空間の指定されているXML、それもプリフィックス無し、デフォルト名前空間というやつが含まれるとき。そういうときはどうしたらよいんでしょうか？ ※「トホホな疑問」投稿順Indexはこちら最初に名前空間を使用していないXMLで、lxmlのXPath使って「便利」な例を掲げておきます。サンプルに使用したXMLは以下のようなズボラなものです。 <?xml version="1.0" encoding="UTF-8" ?> <sample> <rec> <title>t1</title> <body>
GitHub - serpapi/nokolexbor: High-performance HTML5 parser for Ruby based on Lexbor, with support for both CSS selectors and XPath.
- 4 users
- github.com/serpapi
- テクノロジー
- 2022/12/20
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
- ruby
[Python] JSONをXPath風に操作するJSONPath
- 4 users
- www.sukerou.com
- テクノロジー
- 2020/06/03
最近ではすっかり、XMLよりJSON形式のAPIが多いですね。そこで、JSONでもXPATHのように、クエリ形式で要素を検索したいと思い、 jsonpath-ngというよさげなライブラリを見つけたので、それを紹介したいと思います。スポンサーリンクインストール $ pip install --upgrade jsonpath-ng さっそく試してみるリストの下の要素を検索する例です。 from jsonpath_ng import jsonpath, parse # 実験用のJSONデータ(dict) json = { 'foo': [ {'baz': 1}, {'baz': 2} ] } # fooリスト以下のbaz要素を検索 jsonpath_expr = parse('foo[*].baz') matches = jsonpath_expr.find(json) # 結果を表示
- JSON
- Python
WebスクレイピングのためのXPath学習ノート
- 3 users
- zenn.dev/kanoekakihito
- テクノロジー
- 2022/01/13
htmlのツリー構造を決める人がちょいちょい構造を変えることが分かり、子要素から親要素へ向かっての検索を行いたかった。使用したライブラリがコメントアウトされたhtmlタグに反応するので、最初に取り除きたかった。よって資料が少なかったXPathを選択。classやidの名前や名づけルールを変えられたら困るけど、それはまあ仕方ないかなと思っている。 XPath学習資料自分が探した範囲では以下のURLが参考になった。文字ベースの資料初めて入門するのに読みやすい記事（*２つはほぼ同一内容）便利なXPathまとめ - ZOZO TECH BLOG クローラ作成に必須！XPATHの記法まとめ - Qiita XPathに対して「何だこれ・・・」と混乱した頭でも落ち着いて読めば理解できる平易さだった。大変助けられた。分量はあるが良い入門 XPath | TECHSCORE(テックスコア)
XPath
- 3 users
- vicugna-pacos.github.io
- 学び
- 2022/08/11
参考xpath cover page - W3CXPath | MDNクローラ作成に必須！XPATHの記法まとめ - QiitaXPath | TECHSCORE(テックスコア)サンプル↓ルート要素からツリー構造を指定。 /html/body/h1 ↓途中までのツリー構造の指定を省略。ツリー構造の途中で使うことも可能。 //h1 /html//a //div//a ↓属性名と値を指定。 //h1[@class='header1'] ↓属性名を指定。値は問わない。 //h1[@class] //*[@class] ↓指定する文字列が含まれる要素を取得。 //h1[contains(@class, 'head')] 第1引数：文字列が含まれているかどうか調査する対象第2引数：文字列↓タグ内テキストを検索対象にしたい場合。 //h1[contains(text(), '見出し')] ただし、この
- text
Javascript Generators, Meet XPath
- 3 users
- jack.wrenn.fyi
- テクノロジー
- 2020/08/25
Using Generators to Modernize a Geriatric Javascript API for $CURRENT_YEAR How do you find-and-replace text on an HTML page? <div>Hello, <span>human</span>!</div> If the text is neatly neatly isolated inside an HTML element, it’s easy; this will do: document.querySelector("span").textContent = "evolved ape"; But here’s a puzzle: how do you you change text that isn’t neatly isolated in an HTML elem
- xpath
- js