Е
Евгений_Канусовский@198124 сентября 2018 г. 12:47

Чтение файлов в python

Добрый вечер Евгений и форумчане! Столкнулся с проблемой чтения файлов в python: файлы с обычным текстом в формате las и txt читаются, например:

~Version information
VERS.                            1.20: CWLS LAS  -  VERSION 1.20
WRAP.                              NO: One line per depth step

~Well information

Но если текст такого вида (с абракадаброй):

~Version information block
VERS.                             1.20:Ќ з «м­ п Ј«гЎЁ­  § ¬Ґа
WRAP.                       137.60:Љ®­Ґз­ п Ј«гЎЁ­  § ¬Ґа
TYPE.                                ѓ€‘: ‚Ё¤ ЇҐаҐ¤ ў Ґ¬ле ¤ ­­ле

программа вылетает. Не подскажите как лечится?

Рекомендуем хостинг TIMEWEB
Рекомендуем хостинг TIMEWEB
Стабильный хостинг, на котором располагается социальная сеть EVILEG. Для проектов на Django рекомендуем VDS хостинг.

Вам это нравится? Поделитесь в социальных сетях!

18
Evgenii Legotckoi
  • 25 сентября 2018 г. 3:20

День добрый!

А киньте код вашей программы, который отвечает за чтение. Возможно, что вы как-то криво читаете кодировку. Может там кодировка, которая имеет меньше байт на символ, которую вы используете, поэтому и вылетает за пределы текстового массива указатель при чтении.

    Е
    • 25 сентября 2018 г. 11:57

    Вот код:


    import sys

    from re import match

    from vira import *
    from PyQt5 import QtCore, QtGui, QtWidgets
    from PyQt5.QtWidgets import (QDialog, QFileDialog, QMessageBox, QLineEdit, QProgressBar, QProgressDialog)
    from PyQt5.QtCore import QDir, QDirIterator


    class MyWin(QtWidgets.QMainWindow):
    def __init__(self, parent=None):
    QtWidgets.QWidget.__init__(self, parent)
    self.ui = Ui_MainWindow()
    self.ui.setupUi(self)

    # Вешаем на кнопку функцию Open
    self.ui.pushButton.clicked.connect(self.Open)
    self.ui.pushButton_2.clicked.connect(self.close)

    def Open(self):
    self.ui.textEdit.clear()
    files, _ = QFileDialog.getOpenFileNames(self, "Выбрать файлы", "/home", "*.las *.txt")
    hjh = list(filter(lambda x: x != '*.las *.txt', files))
    myString = '\n'.join(hjh)
    self.ui.textEdit.setText(myString)
    if self.ui.comboBox.currentIndex() == 0:
    strx = self.ui.textEdit.toPlainText()
    strxList = strx.split('\n')

    for jk in range(0, len(strxList), 1):
    print(strxList[jk])
    self.ui.textEdit.append(str(strxList[jk]))
    f = open(strxList[jk], 'r')
    for line in f:
    print(line)
    self.ui.textEdit.append(line)
    f.close()

    if __name__ == "__main__":
    app = QtWidgets.QApplication(sys.argv)
    myapp = MyWin()
    myapp.show()
    sys.exit(app.exec_())

      Извиняюсь, не проверил код у себя ещё. В каком именно месте падает? Вы определили это?

        Е
        • 27 сентября 2018 г. 6:15
      • Вот здесь:
      • for jk in range(0, len(strxList), 1):
      • print(strxList[jk])
      • self.ui.textEdit.append(str(strxList[jk]))
      • f = open(strxList[jk], 'r')
      • for line in f:
      • print(line)
      • self.ui.textEdit.append(line)
      • f.close()
      • strxList - это список файлов считанный с textedit, когда начинаю перебирать каждый элемент списка нормальные файлы читаются и выводятся в консоль и textedit, а когда попадается файл с "абракадаброй" программа вылетает 

          Похоже, что здесь сам вывод print у Python крашится из-за кодировки символов.

          Попрбуйте установить кодировку для потока вывода.

          Что вроде такого может быть

          UTF8Writer = codecs.getwriter('utf8')
          sys.stdout = UTF8Writer(sys.stdout)

            Е
            • 27 сентября 2018 г. 6:25
            codecs подчеркивается
              import codecs
                Е
                • 27 сентября 2018 г. 6:35
                import codecs
                for jk in range(0,len(strxList),1):
                print(strxList[jk])
                self.ui.textEdit.append(str(strxList[jk]))
                UTF8Writer = codecs.getwriter ('utf8')
                sys.stdout = UTF8Writer (sys.stdout)
                f = open(strxList[jk], 'r')
                for line in f:
                print(line)
                self.ui.textEdit.append(line)
                f.close()
                  Е
                  • 27 сентября 2018 г. 6:35

                  Я правильно скомпоновал код?

                    import codecs

                    Я бы добавил в самом начале файла

                    UTF8Writer = codecs.getwriter ('utf8')
                    sys.stdout = UTF8Writer (sys.stdout)

                    А это я думаю, стоит добавить перед ээтой строкой

                    app = QtWidgets.QApplication(sys.argv)
                      Е
                      • 27 сентября 2018 г. 6:46

                      Программа вообще не запускается

                        А что пишет?

                          Evgenii Legotckoi
                          • 27 сентября 2018 г. 6:55

                          Так, а если тогда просто файл открывать с учётом кодировки?

                          f = codecs.open(filename, encoding="utf-8")
                            Е
                            • 27 сентября 2018 г. 6:57

                            Process finished with exit code 3

                              Е
                              • 27 сентября 2018 г. 7:02

                              Опять вылетает

                                Е
                                • 29 сентября 2018 г. 1:47

                                Решение найдено:

                                f = codecs.open (strxList[jk], 'r', encoding='cp866')
                                  Е
                                  • 29 сентября 2018 г. 5:40

                                  Спасибо Евгений Вам за то что направили на путь истинный!

                                    Пожалуйста, успехов.

                                      Комментарии

                                      Только авторизованные пользователи могут публиковать комментарии.
                                      Пожалуйста, авторизуйтесь или зарегистрируйтесь
                                      г
                                      • ги
                                      • 23 апреля 2024 г. 22:51

                                      C++ - Тест 005. Структуры и Классы

                                      • Результат:41баллов,
                                      • Очки рейтинга-8
                                      l
                                      • laei
                                      • 23 апреля 2024 г. 16:19

                                      C++ - Тест 004. Указатели, Массивы и Циклы

                                      • Результат:10баллов,
                                      • Очки рейтинга-10
                                      l
                                      • laei
                                      • 23 апреля 2024 г. 16:17

                                      C++ - Тест 003. Условия и циклы

                                      • Результат:50баллов,
                                      • Очки рейтинга-4
                                      Последние комментарии
                                      k
                                      kmssr9 февраля 2024 г. 2:43
                                      Qt Linux - Урок 001. Автозапуск Qt приложения под Linux как сделать автозапуск для флэтпака, который не даёт создавать файлы в ~/.config - вот это вопрос ))
                                      АК
                                      Анатолий Кононенко5 февраля 2024 г. 9:50
                                      Qt WinAPI - Урок 007. Работаем с ICMP Ping в Qt Без строки #include <QRegularExpressionValidator> в заголовочном файле не работает валидатор.
                                      EVA
                                      EVA25 декабря 2023 г. 18:30
                                      Boost - статическая линковка в CMake проекте под Windows Ошибка LNK1104 часто возникает, когда компоновщик не может найти или открыть файл библиотеки. В вашем случае, это файл libboost_locale-vc142-mt-gd-x64-1_74.lib из библиотеки Boost для C+…
                                      J
                                      JonnyJo25 декабря 2023 г. 16:38
                                      Boost - статическая линковка в CMake проекте под Windows Сделал всё по-как у вас, но выдаёт ошибку [build] LINK : fatal error LNK1104: не удается открыть файл "libboost_locale-vc142-mt-gd-x64-1_74.lib" Хоть убей, не могу понять в чём дел…
                                      G
                                      Gvozdik19 декабря 2023 г. 5:01
                                      Qt/C++ - Урок 056. Подключение библиотеки Boost в Qt для компиляторов MinGW и MSVC Для решения твой проблемы добавь в файл .pro строчку "LIBS += -lws2_32" она решит проблему , лично мне помогло.
                                      Сейчас обсуждают на форуме
                                      G
                                      Gar22 апреля 2024 г. 12:46
                                      Clipboard Как скопировать окно целиком в clipb?
                                      DA
                                      Dr Gangil Academics20 апреля 2024 г. 14:45
                                      Unlock Your Aesthetic Potential: Explore MSC in Facial Aesthetics and Cosmetology in India Embark on a transformative journey with an msc in facial aesthetics and cosmetology in india . Delve into the intricate world of beauty and rejuvenation, guided by expert faculty and …
                                      a
                                      a_vlasov14 апреля 2024 г. 13:41
                                      Мобильное приложение на C++Qt и бэкенд к нему на Django Rest Framework Евгений, добрый день! Такой вопрос. Верно ли следующее утверждение: Любое Android-приложение, написанное на Java/Kotlin чисто теоретически (пусть и с большими трудностями) можно написать и на C+…
                                      Павел Дорофеев
                                      Павел Дорофеев14 апреля 2024 г. 9:35
                                      QTableWidget с 2 заголовками Вот тут есть кастомный QTableView с многорядностью проект поддерживается, обращайтесь
                                      f
                                      fastrex4 апреля 2024 г. 11:47
                                      Вернуть старое поведение QComboBox, не менять индекс при resetModel Добрый день! У нас много проектов в которых используется QComboBox, в версии 5.5.1, когда модель испускает сигнал resetModel, currentIndex не менялся. В версии 5.15 при resetModel происходит try…

                                      Следите за нами в социальных сетях