Previous Entry Share Next Entry
QRegExp
Шар
hegan_gray wrote in ru_qt
Комрады, есть проблема:
получаю новостные сообщения с сервера Reuters. Тело новости выдираю, но оно в каком-то html-образном виде. Я не могу назвать это чистым html, потому что тэг Origin, встречающийся там постоянно по тексту, не понимается ни одним браузером.
Хочу вырезать из новостного сообщения все тэги вида
<origin href="blah-blah-blah">blah-blah-blah</origin>

Помогите, пожалуйста, составить регулярное выражение, а то не получается никак.

x-post ru_qt4

  • 1
Нет, внутренности тоже оставлять не хотелось. Хотелось вырезать всё, включая внутренности.
Моё выражение режет именно то, что описано в посте, включая адрес ссылки и текст ссылки. Если хотите, проверьте сами.
А использовать вебкит для того, что делается регэкспом и методами QString, это как из пушки по воробьям. Тем более, что у меня пока что 4.5.3, руки не дошли до 4.6 обновиться.

  • 1
?

Log in