Е
Евгений_Канусовский@1981Қыр. 24, 2018, 12:47 Т.Қ.

Чтение файлов в python

Добрый вечер Евгений и форумчане! Столкнулся с проблемой чтения файлов в python: файлы с обычным текстом в формате las и txt читаются, например:

~Version information
VERS.                            1.20: CWLS LAS  -  VERSION 1.20
WRAP.                              NO: One line per depth step

~Well information

Но если текст такого вида (с абракадаброй):

~Version information block
VERS.                             1.20:Ќ з «м­ п Ј«гЎЁ­  § ¬Ґа
WRAP.                       137.60:Љ®­Ґз­ п Ј«гЎЁ­  § ¬Ґа
TYPE.                                ѓ€‘: ‚Ё¤ ЇҐаҐ¤ ў Ґ¬ле ¤ ­­ле

программа вылетает. Не подскажите как лечится?

Рекомендуем хостинг TIMEWEB
Рекомендуем хостинг TIMEWEB
Стабильный хостинг, на котором располагается социальная сеть EVILEG. Для проектов на Django рекомендуем VDS хостинг.

Ол саған ұнайды ма? Әлеуметтік желілерде бөлісіңіз!

18
Evgenii Legotckoi
  • Қыр. 25, 2018, 3:20 Т.Ж.

День добрый!

А киньте код вашей программы, который отвечает за чтение. Возможно, что вы как-то криво читаете кодировку. Может там кодировка, которая имеет меньше байт на символ, которую вы используете, поэтому и вылетает за пределы текстового массива указатель при чтении.

    Е
    • Қыр. 25, 2018, 11:57 Т.Ж.

    Вот код:


    import sys

    from re import match

    from vira import *
    from PyQt5 import QtCore, QtGui, QtWidgets
    from PyQt5.QtWidgets import (QDialog, QFileDialog, QMessageBox, QLineEdit, QProgressBar, QProgressDialog)
    from PyQt5.QtCore import QDir, QDirIterator


    class MyWin(QtWidgets.QMainWindow):
    def __init__(self, parent=None):
    QtWidgets.QWidget.__init__(self, parent)
    self.ui = Ui_MainWindow()
    self.ui.setupUi(self)

    # Вешаем на кнопку функцию Open
    self.ui.pushButton.clicked.connect(self.Open)
    self.ui.pushButton_2.clicked.connect(self.close)

    def Open(self):
    self.ui.textEdit.clear()
    files, _ = QFileDialog.getOpenFileNames(self, "Выбрать файлы", "/home", "*.las *.txt")
    hjh = list(filter(lambda x: x != '*.las *.txt', files))
    myString = '\n'.join(hjh)
    self.ui.textEdit.setText(myString)
    if self.ui.comboBox.currentIndex() == 0:
    strx = self.ui.textEdit.toPlainText()
    strxList = strx.split('\n')

    for jk in range(0, len(strxList), 1):
    print(strxList[jk])
    self.ui.textEdit.append(str(strxList[jk]))
    f = open(strxList[jk], 'r')
    for line in f:
    print(line)
    self.ui.textEdit.append(line)
    f.close()

    if __name__ == "__main__":
    app = QtWidgets.QApplication(sys.argv)
    myapp = MyWin()
    myapp.show()
    sys.exit(app.exec_())

      Извиняюсь, не проверил код у себя ещё. В каком именно месте падает? Вы определили это?

      • Вот здесь:
      • for jk in range(0, len(strxList), 1):
      • print(strxList[jk])
      • self.ui.textEdit.append(str(strxList[jk]))
      • f = open(strxList[jk], 'r')
      • for line in f:
      • print(line)
      • self.ui.textEdit.append(line)
      • f.close()
      • strxList - это список файлов считанный с textedit, когда начинаю перебирать каждый элемент списка нормальные файлы читаются и выводятся в консоль и textedit, а когда попадается файл с "абракадаброй" программа вылетает 

          Похоже, что здесь сам вывод print у Python крашится из-за кодировки символов.

          Попрбуйте установить кодировку для потока вывода.

          Что вроде такого может быть

          UTF8Writer = codecs.getwriter('utf8')
          sys.stdout = UTF8Writer(sys.stdout)

            codecs подчеркивается
              import codecs
                import codecs
                for jk in range(0,len(strxList),1):
                print(strxList[jk])
                self.ui.textEdit.append(str(strxList[jk]))
                UTF8Writer = codecs.getwriter ('utf8')
                sys.stdout = UTF8Writer (sys.stdout)
                f = open(strxList[jk], 'r')
                for line in f:
                print(line)
                self.ui.textEdit.append(line)
                f.close()

                  Я правильно скомпоновал код?

                    import codecs

                    Я бы добавил в самом начале файла

                    UTF8Writer = codecs.getwriter ('utf8')
                    sys.stdout = UTF8Writer (sys.stdout)

                    А это я думаю, стоит добавить перед ээтой строкой

                    app = QtWidgets.QApplication(sys.argv)

                      Программа вообще не запускается

                        А что пишет?

                          Evgenii Legotckoi
                          • Қыр. 27, 2018, 6:55 Т.Ж.

                          Так, а если тогда просто файл открывать с учётом кодировки?

                          f = codecs.open(filename, encoding="utf-8")

                            Process finished with exit code 3

                              Опять вылетает

                                Решение найдено:

                                f = codecs.open (strxList[jk], 'r', encoding='cp866')

                                  Спасибо Евгений Вам за то что направили на путь истинный!

                                    Пожалуйста, успехов.

                                      Пікірлер

                                      Тек рұқсаты бар пайдаланушылар ғана пікір қалдыра алады.
                                      Кіріңіз немесе Тіркеліңіз
                                      OI
                                      • Ora Iro
                                      • Жел. 24, 2024, 6:38 Т.Ж.

                                      C++ - Тест 001. Первая программа и типы данных

                                      • Нәтиже:40ұпай,
                                      • Бағалау ұпайлары-8
                                      AD

                                      C++ - Тест 004. Указатели, Массивы и Циклы

                                      • Нәтиже:50ұпай,
                                      • Бағалау ұпайлары-4
                                      m
                                      • molni99
                                      • Қаз. 26, 2024, 1:37 Т.Ж.

                                      C++ - Тест 004. Указатели, Массивы и Циклы

                                      • Нәтиже:80ұпай,
                                      • Бағалау ұпайлары4
                                      Соңғы пікірлер
                                      ИМ
                                      Игорь МаксимовҚар. 22, 2024, 11:51 Т.Ж.
                                      Django - Оқулық 017. Теңшелген Django кіру беті Добрый вечер Евгений! Я сделал себе авторизацию аналогичную вашей, все работает, кроме возврата к предидущей странице. Редеректит всегда на главную, хотя в логах сервера вижу запросы на правильн…
                                      Evgenii Legotckoi
                                      Evgenii LegotckoiҚаз. 31, 2024, 2:37 Т.Қ.
                                      Django - Сабақ 064. Python Markdown кеңейтімін қалай жазуға болады Добрый день. Да, можно. Либо через такие же плагины, либо с постобработкой через python библиотеку Beautiful Soup
                                      A
                                      ALO1ZEҚаз. 19, 2024, 8:19 Т.Ж.
                                      Qt Creator көмегімен fb3 файл оқу құралы Подскажите как это запустить? Я не шарю в программировании и кодинге. Скачал и установаил Qt, но куча ошибок выдается и не запустить. А очень надо fb3 переконвертировать в html
                                      ИМ
                                      Игорь МаксимовҚаз. 5, 2024, 7:51 Т.Ж.
                                      Django - Сабақ 064. Python Markdown кеңейтімін қалай жазуға болады Приветствую Евгений! У меня вопрос. Можно ли вставлять свои классы в разметку редактора markdown? Допустим имея стандартную разметку: <ul> <li></li> <li></l…
                                      d
                                      dblas5Шілде 5, 2024, 11:02 Т.Ж.
                                      QML - Сабақ 016. SQLite деректер қоры және онымен QML Qt-та жұмыс істеу Здравствуйте, возникает такая проблема (я новичок): ApplicationWindow неизвестный элемент. (М300) для TextField и Button аналогично. Могу предположить, что из-за более новой верси…
                                      Енді форумда талқылаңыз
                                      Evgenii Legotckoi
                                      Evgenii LegotckoiМаусым 24, 2024, 3:11 Т.Қ.
                                      добавить qlineseries в функции Я тут. Работы оень много. Отправил его в бан.
                                      t
                                      tonypeachey1Қар. 15, 2024, 6:04 Т.Ж.
                                      google domain [url=https://google.com/]domain[/url] domain [http://www.example.com link title]
                                      NSProject
                                      NSProjectМаусым 4, 2022, 3:49 Т.Ж.
                                      Всё ещё разбираюсь с кешем. В следствии прочтения данной статьи. Я принял для себя решение сделать кеширование свойств менеджера модели LikeDislike. И так как установка evileg_core для меня не была возможна, ибо он писался…
                                      9
                                      9AnonimҚаз. 25, 2024, 9:10 Т.Ж.
                                      Машина тьюринга // Начальное состояние 0 0, ,<,1 // Переход в состояние 1 при пустом символе 0,0,>,0 // Остаемся в состоянии 0, двигаясь вправо при встрече 0 0,1,>…

                                      Бізді әлеуметтік желілерде бақылаңыз