Чтение файлов в python

Добрый вечер Евгений и форумчане! Столкнулся с проблемой чтения файлов в python: файлы с обычным текстом в формате las и txt читаются, например:

~Version information
VERS.                            1.20: CWLS LAS  -  VERSION 1.20
WRAP.                              NO: One line per depth step

~Well information

Но если текст такого вида (с абракадаброй):

~Version information block
VERS.                             1.20:Ќ з «м­ п Ј«гЎЁ­  § ¬Ґа
WRAP.                       137.60:Љ®­Ґз­ п Ј«гЎЁ­  § ¬Ґа
TYPE.                                ѓ€‘: ‚Ё¤ ЇҐаҐ¤ ў Ґ¬ле ¤ ­­ле

программа вылетает. Не подскажите как лечится?

We recommend hosting TIMEWEB
We recommend hosting TIMEWEB
Stable hosting, on which the social network EVILEG is located. For projects on Django we recommend VDS hosting.

Do you like it? Share on social networks!

18
Evgenii Legotckoi
  • Sept. 25, 2018, 3:20 a.m.

День добрый!

А киньте код вашей программы, который отвечает за чтение. Возможно, что вы как-то криво читаете кодировку. Может там кодировка, которая имеет меньше байт на символ, которую вы используете, поэтому и вылетает за пределы текстового массива указатель при чтении.


    Вот код:


    import sys

    from re import match

    from vira import *
    from PyQt5 import QtCore, QtGui, QtWidgets
    from PyQt5.QtWidgets import (QDialog, QFileDialog, QMessageBox, QLineEdit, QProgressBar, QProgressDialog)
    from PyQt5.QtCore import QDir, QDirIterator


    class MyWin(QtWidgets.QMainWindow):
    def __init__(self, parent=None):
    QtWidgets.QWidget.__init__(self, parent)
    self.ui = Ui_MainWindow()
    self.ui.setupUi(self)

    # Вешаем на кнопку функцию Open
    self.ui.pushButton.clicked.connect(self.Open)
    self.ui.pushButton_2.clicked.connect(self.close)

    def Open(self):
    self.ui.textEdit.clear()
    files, _ = QFileDialog.getOpenFileNames(self, "Выбрать файлы", "/home", "*.las *.txt")
    hjh = list(filter(lambda x: x != '*.las *.txt', files))
    myString = '\n'.join(hjh)
    self.ui.textEdit.setText(myString)
    if self.ui.comboBox.currentIndex() == 0:
    strx = self.ui.textEdit.toPlainText()
    strxList = strx.split('\n')

    for jk in range(0, len(strxList), 1):
    print(strxList[jk])
    self.ui.textEdit.append(str(strxList[jk]))
    f = open(strxList[jk], 'r')
    for line in f:
    print(line)
    self.ui.textEdit.append(line)
    f.close()

    if __name__ == "__main__":
    app = QtWidgets.QApplication(sys.argv)
    myapp = MyWin()
    myapp.show()
    sys.exit(app.exec_())

      Извиняюсь, не проверил код у себя ещё. В каком именно месте падает? Вы определили это?

      • Вот здесь:
      • for jk in range(0, len(strxList), 1):
      • print(strxList[jk])
      • self.ui.textEdit.append(str(strxList[jk]))
      • f = open(strxList[jk], 'r')
      • for line in f:
      • print(line)
      • self.ui.textEdit.append(line)
      • f.close()
      • strxList - это список файлов считанный с textedit, когда начинаю перебирать каждый элемент списка нормальные файлы читаются и выводятся в консоль и textedit, а когда попадается файл с "абракадаброй" программа вылетает 

          Похоже, что здесь сам вывод print у Python крашится из-за кодировки символов.

          Попрбуйте установить кодировку для потока вывода.

          Что вроде такого может быть

          UTF8Writer = codecs.getwriter('utf8')
          sys.stdout = UTF8Writer(sys.stdout)

            codecs подчеркивается
              import codecs
                import codecs
                for jk in range(0,len(strxList),1):
                print(strxList[jk])
                self.ui.textEdit.append(str(strxList[jk]))
                UTF8Writer = codecs.getwriter ('utf8')
                sys.stdout = UTF8Writer (sys.stdout)
                f = open(strxList[jk], 'r')
                for line in f:
                print(line)
                self.ui.textEdit.append(line)
                f.close()

                  Я правильно скомпоновал код?

                    import codecs

                    Я бы добавил в самом начале файла

                    UTF8Writer = codecs.getwriter ('utf8')
                    sys.stdout = UTF8Writer (sys.stdout)

                    А это я думаю, стоит добавить перед ээтой строкой

                    app = QtWidgets.QApplication(sys.argv)

                      Программа вообще не запускается

                        А что пишет?

                          Evgenii Legotckoi
                          • Sept. 27, 2018, 6:55 a.m.

                          Так, а если тогда просто файл открывать с учётом кодировки?

                          f = codecs.open(filename, encoding="utf-8")

                            Process finished with exit code 3

                              Опять вылетает

                                Решение найдено:

                                f = codecs.open (strxList[jk], 'r', encoding='cp866')

                                  Спасибо Евгений Вам за то что направили на путь истинный!

                                    Пожалуйста, успехов.

                                      Comments

                                      Only authorized users can post comments.
                                      Please, Log in or Sign up
                                      AD

                                      C ++ - Test 004. Pointers, Arrays and Loops

                                      • Result:50points,
                                      • Rating points-4
                                      m

                                      C ++ - Test 004. Pointers, Arrays and Loops

                                      • Result:80points,
                                      • Rating points4
                                      m

                                      C ++ - Test 004. Pointers, Arrays and Loops

                                      • Result:20points,
                                      • Rating points-10
                                      Last comments
                                      i
                                      innorwallNov. 14, 2024, 7:03 a.m.
                                      How to make game using Qt - Lesson 3. Interaction with other objects what is priligy tablets What happens during the LASIK surgery process
                                      i
                                      innorwallNov. 14, 2024, 4:09 a.m.
                                      Using variables declared in CMakeLists.txt inside C ++ files where can i buy priligy online safely Tom Platz How about things like we read about in the magazines like roid rage and does that really
                                      i
                                      innorwallNov. 12, 2024, 6:12 a.m.
                                      Django - Tutorial 055. How to write auto populate field functionality Freckles because of several brand names retin a, atralin buy generic priligy
                                      i
                                      innorwallNov. 12, 2024, 2:23 a.m.
                                      QML - Tutorial 035. Using enumerations in QML without C ++ priligy cvs 24 Together with antibiotics such as amphotericin B 10, griseofulvin 11 and streptomycin 12, chloramphenicol 9 is in the World Health Organisation s List of Essential Medici…
                                      i
                                      innorwallNov. 11, 2024, 11:50 p.m.
                                      Qt/C++ - Lesson 052. Customization Qt Audio player in the style of AIMP It decreases stress, supports hormone balance, and regulates and increases blood flow to the reproductive organs buy priligy online safe Promising data were reported in a PDX model re…
                                      Now discuss on the forum
                                      i
                                      innorwallNov. 14, 2024, 8:39 a.m.
                                      добавить qlineseries в функции Listen intently to what Jerry says about Conditional Acceptance because that s the bargaining chip in the song and dance you will have to engage in to protect yourself and your family from AMI S…
                                      i
                                      innorwallNov. 11, 2024, 6:55 p.m.
                                      Всё ещё разбираюсь с кешем. priligy walgreens levitra dulcolax carbs The third ring was found to be made up of ultra relativistic electrons, which are also present in both the outer and inner rings
                                      9
                                      9AnonimOct. 25, 2024, 4:10 p.m.
                                      Машина тьюринга // Начальное состояние 0 0, ,<,1 // Переход в состояние 1 при пустом символе 0,0,>,0 // Остаемся в состоянии 0, двигаясь вправо при встрече 0 0,1,>…

                                      Follow us in social networks