Как я могу превратить строку HTML в объект DOM в расширении Firefox?

Я загружаю веб-страницу (тег супа HTML) с помощью XMLHttpRequest и хочу получить выходные данные и превратить их в объект DOM, с помощью которого я могу затем выполнять запросы XPATH. Как мне преобразовать строку в объект DOM?

Похоже, что общим решением является создание скрытого iframe и добавление в него содержимого строки. Там было говорить об обновлении DomParser для поддержки текста / HTML , а как в Firefox 3.0.1 вы все еще получаете , NS_ERROR_NOT_IMPLEMENTEDесли вы попробуете.

Есть ли вариант, кроме использования скрытого трюка iframe? А если нет, как лучше всего выполнить трюк iframe, чтобы ваш код работал вне контекста любых открытых в данный момент вкладок (чтобы закрывающие вкладки не испортили код и т. Д.)?

Это пример того, почему я ищу решение, отличное от взлома iframe, если мне нужно написать весь этот код, чтобы иметь надежное решение, то я бы предпочел продолжать искать что-то другое.

6.08.2008 19:08:19
5 ОТВЕТОВ
РЕШЕНИЕ

Сегодня у Ajaxian была запись о вставке / извлечении html из iframe . Вы можете использовать фрагмент js, который они там разместили.

Что касается обработки закрытия браузера / вкладки, вы можете присоединиться к событию onbeforeunload ( http://msdn.microsoft.com/en-us/library/ms536907(VS.85).aspx ) и делать все, что вам нужно сделать ,

10
6.08.2008 20:50:05

Попробуй это:

var request = new XMLHttpRequest();

request.overrideMimeType( 'text/xml' );
request.onreadystatechange = process;
request.open ( 'GET', url );
request.send( null );

function process() { 
    if ( request.readyState == 4 && request.status == 200 ) {
        var xml = request.responseXML;
    }
}

Обратите внимание на overrideMimeType и responseXML . Является «завершена».
readyState == 4

6
5.04.2018 20:35:16
Это не работает, если ответ не является допустимым XML для начала. Если вы скажете Firefox ожидать XML, он будет строго следить за тем, что он будет анализировать.
thelsdj 6.06.2010 23:07:43

Попробуйте создать div

document.createElement( 'div' );

А затем установите тег супа HTML на innerHTML элемента div. Браузер должен обработать это в XML, который затем можно проанализировать.

Свойство innerHTML принимает строку, которая определяет допустимое сочетание текста и элементов. Когда свойство innerHTML установлено, данная строка полностью заменяет существующее содержимое объекта. Если строка содержит HTML-теги, она анализируется и форматируется по мере помещения в документ.

2
6.08.2008 20:03:04
Проблема в том, что мне нужен весь HTML-документ, <head> и все, что он выбрасывает. Также я пытаюсь не использовать существующие окна / вкладки, потому что мой код работает вне их контекста, и я хочу быть устойчивым к случайному закрытию пользователем окна или вкладки, что приводит к прерыванию моего кода (при условии, что Firefox все еще работает).
thelsdj 6.06.2010 23:08:40

Итак, вы хотите загрузить веб-страницу в виде объекта XML с использованием JavaScript, но не хотите использовать веб-страницу? Поскольку у вас нет контроля над тем, что будет делать пользователь (закрытие вкладок, окон или чего-либо еще), вам нужно будет сделать это, как виджет OSX Dashboard или какое-то отдельное приложение. Расширение Firefox также будет работать, если вам не нужно беспокоиться о закрытии браузера пользователем.

1
6.08.2008 20:22:10
Да, я использую расширение Firefox, но большинство примеров iframe используют произвольное окно браузера, а не объект в основном процессе, чтобы быть устойчивыми к закрытию браузера / вкладки.
thelsdj 6.06.2010 23:08:05

Есть ли вариант, кроме использования скрытого трюка iframe?

К сожалению, нет, не сейчас. В противном случае код микросуммы, на который вы указываете, использовал бы его вместо этого.

А если нет, как лучше всего выполнить трюк iframe, чтобы ваш код работал вне контекста любых открытых в данный момент вкладок (чтобы закрывающие вкладки не испортили код и т. Д.)?

Код, который вы цитировали, использует последнее окно браузера, поэтому закрытие вкладок не повлияет на синтаксический анализ. Закрытие этого окна браузера прервет вашу загрузку, но вы можете справиться с ней (например, обнаружить, что загрузка прервана и перезапустить ее в другом окне), и это происходит не очень часто.

Вам нужно окно DOM для правильной работы iframe, поэтому на данный момент нет чистого решения (если вы заинтересованы в использовании парсера mozilla).

1
12.08.2008 18:56:54